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PRÉFACE 


Le monde scientifique est de plus en plus imprégné de mathématiques, ou de 
mathématique — le singulier, rare dans le langage courant, semblant néanmoins 
préférable. C’est pourquoi cette discipline a pris une place de choix dans l’ensei- 
gnement : tout élève, au cours de ses études, y est nécessairement confronté. 
Mais, à la fois valorisée et redoutée, elle garde, au-delà des rudiments dispensés 
au collège et au lycée, une aura de mystère : seuls quelques initiés ont le privilè- 
ge de faire des recherches en mathématiques, ou même simplement d’avoir une 
claire vision de ce qu’elles sont. 

Dès sa première édition (1968-1974), Y Encyclopœdia Universalis a voulu offrir au 
public une vue d’ensemble des mathématiques contemporaines et de leur déve- 
loppement historique. L’ambition de ce projet — les exigences propres à la 
présentation de cette discipline s’ajoutant à celles qui sont inhérentes à toute entre- 
prise encyclopédique — en rehausse la réussite. 

Le présent ouvrage, qui rassemble l’essentiel des questions d’algèbre, analyse, arith- 
métique et théorie des nombres, géométrie, topologie, algèbre topologique et géo- 
métrie algébrique, offre un vaste panorama qui permet de saisir la démarche, les 
acquis, les avancées des inventeurs de cette architecture abstraite qu’est la mathé- 
matique. Un second volume réunira les interrogations sur les fondements, les 
articles spécifiques historiques, ainsi que tout ce qui touche aux probabilités, aux 
statistiques et à la plupart des applications. 

« Architecture abstraite », disions-nous. En effet, à partir de quelques notions 
premières, telles qu’« ensemble », « élément », « appartenance », et de quelques 
axiomes, les structures mathématiques — dans le cadre desquelles tous calculs et 
démonstrations se font — ne se déploient-elles pas progressivement les unes à 
partir des autres, des plus « simples » (ensemble ordonné, groupe, espace topo- 
logique...) aux plus « subtiles » (espace disqué, espace localement annelé...) ? 
Là, semble-t-il, réside la beauté mathématique, ou plutôt la partie la plus abstraite 
de cette beauté car, s’il est de belles théories, il est aussi de jolies formules 
(e ijt = — 1) et la formule de Stirling, par exemple), de beaux calculs, de splendides 
démonstrations et, bien sûr, de manière plus visible, des courbes dont l’harmonie 
n’échappe à personne. 

Bien entendu, la contemplation de cette beauté exige un minimum de compré- 
hension, jusqu’où il convient de hisser son esprit : songeons qu’en musique ou 
dans le domaine sportif de sérieux entraînements sont nécessaires si l’on veut 
trouver vraiment du plaisir à jouer d’un instrument ou à pratiquer un sport, a 
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fortiori si l’on veut accéder aux concerts ou aux compétitions. Mais, au moins à 
partir d’un certain niveau, cette activité, sérieuse certes, acquiert une dimension 
ludique : les mathématiques, pour qui les aime, ouvrent aussi sur tout un espace 
de jeux. De sorte que la résolution d’un joli problème peut se révéler aussi dis- 
trayante que, par exemple, une partie d’échecs ou de shogi (un jeu japonais proche 
des échecs). Joie de chercher, joie de trouver, joie de la communion enfin avec 
une beauté qui, pour abstraite qu’elle soit, n’en suscite pas moins de très réels 
plaisirs : qui est capable de faire ainsi des mathématiques est dans une situation 
très voisine de celle de l’alpiniste. 

Au lecteur, à la lectrice, qu’il ou qu’elle soit ou non mathématicien ou mathé- 
maticienne, à tout lecteur tel que le définissait Paul Valéry — c’est-à-dire « de 
bonne foi » autant que « de mauvaise volonté » — de relever le défi... 

Mais la mathématique est aussi et d’abord un langage et, de ce point de vue, 
intéresse linguistes et lexicographes. Chaque mot ou locution reçoit une définition 
précise et, à côté de termes spécifiquement mathématiques (morphisme, simplexe...), 
d’adjectifs honorant un mathématicien (euclidien, eulérien, népérien...) ou une 
mathématicienne (noethérien...), figurent un assez grand nombre de substantifs 
(anneau, clan, corps, distribution, fibre, groupe, lacet, spectre, tribu...) ou d’ad- 
jectifs (complet, conforme, séparé, simple...) empruntés à la langue courante mais 
avec un sens mathématique précis, où l’aspect métaphorique est d’ailleurs parfois 
présent (filtre, noyau, treillis...). De sorte que, au-delà de son aspect faussement 
ésotérique, il y a parfois une certaine poésie, voire une poésie certaine — osons 
aller jusque-là ! —, dans le langage mathématique. Avec une pointe d’humour, un 
grand bol d'enthousiasme et une réserve inépuisable de persévérance, chevauchons 
donc (sur un paraboloïde hyperbolique, évidemment) à travers les univers mathé- 
matiques pour y découvrir les corps algébriquement clos, les endomorphismes dia- 
gonalisables, les espaces bornologiques, les fonctions holomorphes ou les produits 
de convolution. 

L’aventure mathématique, commencée sans doute depuis qu’Adam et Ève ont 
pensé qu’ils étaient deux, n’a certes pas fini de nous passionner. Le présent volume 
de la collection « Encyclopædia Universalis » nous rappelle — alors que le grand 
théorème de Fermât vient enfin, après plus de trois siècles de travaux, d’être 
démontré — qu’il reste bien des questions simples non résolues, par exemple celle- 
ci : existe-t-il une infinité de nombres premiers « jumeaux », c’est-à-dire de nombres 
premiers consécutifs dont la différence est deux ? 


L’Éditeur 
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Présenter les mathématiques contemporaines dans le contexte d’une encyclopédie 
destinée au grand public cultivé pouvait paraître une gageure. Le sujet, dont la 
réputation d’inaccessibilité n’est plus à faire, paraissait devoir être esquivé. 
Néanmoins Y Encyclopœdia Universalis n’a pas hésité, dans ce domaine comme 
dans tous les autres, à garder le modèle qu’elle s’était donné : l’encyclopédie que 
Diderot et d’Alembert ont élaborée pour l’époque des Lumières. Considérant 
qu’il était du devoir des scientifiques de partager leur savoir avec l’ensemble du 
monde cultivé, Diderot et d’Alembert ont découpé le savoir mathématique qui 
leur était contemporain en autant de disciplines et de sous-disciplines, et ont alors 
demandé à ses scientifiques de premier ordre de rédiger ces présentations à 
caractère introductif. 

C’est le même pari qui a été à l’origine de la première conception du traitement 
des mathématiques dès l’édition de 1968 de Y Encyclopœdia Universalis : traiter 
des mathématiques dans leur forme contemporaine de manière à en rendre acces- 
sibles les concepts fondamentaux, les principaux courants, les résultats décisifs à 
des lecteurs possédant une formation scientifique minimale. À ce défi, l’on doit 
ce qui constitue la présentation la plus complète, la plus approfondie de 
l’état actuel des mathématiques dans une entreprise encyclopédique de langue 
française. Une telle tentative n’aurait pu être conçue sans l’intervention décisive 
de Jean Dieudonné. C’est à lui que nous devons l’élaboration en quelques mois 
d’un découpage initial des mathématiques qui allait constituer la trame de l’en- 
treprise pour la première édition. Il a par ailleurs participé activement, comme 
auteur, à de nombreux articles clés avec le style exceptionnel qui le caractérisait 
et qui a donné le ton à l’ensemble de l’œuvre. 

Les mathématiques sont en effet introduites ici de manière historique, dans la 
mesure où la genèse des concepts contemporains nous a paru constituer le meilleur 
accès qui puisse y conduire. La présentation de la partie historique des mathé- 
matiques se prolonge par l’exposé de ces théories sous leur forme moderne. Le 
xix e siècle constitue un moment charnière dans l’évolution des mathématiques, 
et leur présentation s’articule autour de ce constat. Ainsi, l’algèbre se réduit 
d’abord à la théorie des équations, et c’est au xix e siècle que vont naître toutes 
les nouvelles structures. L’article de synthèse sur l’algèbre renvoie aux différentes 
entrées du dictionnaire. L’évolution des conceptions de la géométrie est évoquée 
dans la grande fresque du père Russo. Elle débouche, de manière naturelle, d’une 
part, sur la géométrie différentielle, d’autre part, sur l’étude des courbes algé- 
briques, point de départ de la géométrie algébrique, qui à son tour rencontre la 
théorie des nombres. 
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Fidèle à son impératif d’actualité, Y Encyclopœdia Universalis a voulu par la suite 
refléter la transformation qu’avaient subie les mathématiques, tout comme l’en- 
semble des domaines de la pensée scientifique. La période de 1968 représentait 
l’apogée du structuralisme et du formalisme, qui s’exprimaient en mathématiques 
par la prédominance absolue du bourbakisme, lequel marginalisait certaines branches 
de la discipline. Les décennies ultérieures devaient voir cet impérialisme s’effri- 
ter, et d’autres domaines des mathématiques, comme les mathématiques appli- 
quées jusqu’alors absentes, retrouver leur droit de cité. L’édition de 1984 tient 
compte de cette mutation, grâce à une modification portant sur près de 30 p. 100 
des textes. 

Des quelque deux cent cinquante articles ou notices publiés dans le Corpus de 
Y Encyclopœdia Universalis ainsi que dans les différents volumes annuels ou thé- 
matiques, ce Dictionnaire reprend uniquement les articles qui présentent les grands 
problèmes dégagés au xix e siècle et suivent leurs transformations jusqu’à l’époque 
contemporaine. Le lecteur pourra s’y familiariser avec les nouveaux objets mathé- 
matiques dont l’apparition devait constituer les mathématiques modernes. Il y 
trouvera une présentation contemporaine des théories classiques. Un autre ensemble 
d’articles, traitant des questions épistémologiques historiques ou d’aspects plus 
contemporains fera l’objet d’un recueil ultérieur. 

Bien que d’origine ancienne, certaines applications des mathématiques, comme 
l’analyse numérique, figureront dans ce second volume. Quant au calcul des 
probabilités, dont la naissance date du xvn e siècle, sa présentation axiomatique 
contemporaine, due à Kolmogorov, date de 1933. C’est la raison pour laquelle 
nous en avons réservé, ainsi qu’à la logique mathématique, l’exposé dans ce 
volume ultérieur. 

Ce Dictionnaire des mathématiques se veut ainsi le reflet du foisonnement et de 
l’enchevêtrement des diverses disciplines mathématiques. Comme le soulignait 
souvent Jean Dieudonné, c’est cette « interdisciplinarité » interne qui fait la force 
et l’originalité des mathématiques contemporaines. Les articles de Y Encyclopœdia 
Universalis ont tenté de rendre compte du caractère constamment ouvert de cette 
démarche. 


Jean-Luc VERLEY 



COMMENT UTILISER L'INDEX 


Placé en fin de volume, c’est l’Index qui donne sa valeur proprement encyclopédique 
à ce dictionnaire. C’est par lui que toute recherche ou, plus généralement, toute 
consultation devraient commencer. Nous avons adopté pour sa constitution un 
certain nombre de conventions qui nous sont propres. Le lecteur les trouvera 
définies ci-après, exemples à l’appui, sous la forme d’un tableau. 


* BARYCENTRE 63 


* HILBERT espace de 596 
ALGÈBRE 22 

ERGODIQUE (THEORIE) 332 

groupes - Représentation linéaire 
des groupes 559 
harmonique (analyse) 587, 592 
NORMÉES (ALGÈBRES) 726 


ENTRÉE précédée d’une puce et suivie d’un numéro 
de page : signifie que cette entrée est le titre d’un 
article du dictionnaire, commençant à la page 
indiquée 

ce même type d’entrée peut être suivi de références 


GAUSS carl friedrich (1777-1855) ENTRÉE simple suivie de références 

algèbre 14. J 7 ~| I 

COMPLEXES (NOMBRES) 116 

DIOPHANTIENNES (APPROXIMATIONS) 255 ! 

DIOPHANTIENNES (ÉQUATIONS) 263. 267 
DIVISIBILITÉ 290 


• SUITES 

calcul infinitésimal - Calcul à une — RÉFÉRENCE à un article long : titre d’article 

variable 71 et numéro de page localisant la partie de texte 

convexité - Fonctions convexes 146 pertinente au sein de l’article 
DISTRIBUTIONS 276 
FONCTIONS (REPRÉSENTATION ET 
APPROXIMATION DES) 364, 373, 385 , , 

limite (notion de) REFERENCE à un article court : titre de l’article 


NAPIER john ► NEPER john 

CALCUL SYMBOLIQUE 

► SYMBOLIQUE calcul 


RENVOIS d’un terme à un autre 

pour des raisons relevant de l’orthographe ou du 
système de transcription 

pour des raisons de choix alphabétique 


ALEMBERT théorème de d’ 

► ALGEBRE théorème P our des ralsolls d ordre sémantique 

FONDAMENTAL DE L’ 
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AFFINES ESPACE & REPÈRE 



AFFINE APPLICATION 


S oit E et F deux espaces vectoriels sur 
un corps commutatif K et A et B des 
espaces affines attachés à E et F. On dit 
qu’une application u de A dans B est une 
application linéaire affine (ou application 
affine) si, quelle que soit la famille finie 
d’éléments (M f , À,), pour 1 < /' ^ k, où k 
est quelconque, de A X K, possédant un 
barycentre G, u(G) est le barycentre des 
éléments (w(M,), X,) de B X K. 

On démontre les résultats suivants : 

1. Il existe une application linéaire/ et 
une seule de E dans F telle que, pour tout 
M et tout N dans A et pour M' = w(M) et 
N' = w(N) : 

/( MN) = »(M)«(N) ; 

/ s’appelle l’application linéaire associée 
à u. 

2. La composée v o u de deux appli- 
cations affines m et v est une application 
affine et l’application linéaire associée à 
v o u est g o / (où / et g désignent les 
applications linéaires associées à u et v). 

3. Les applications linéaires affines 
bijectives d’un espace affine A dans lui- 


même forment un groupe, appelé groupe 
affine de A et noté GA(A). Une applica- 
tion affine u de A dans A est bijective si et 
seulement si son application linéaire asso- 
ciée / est aussi bijective. Ainsi l’application 
qui à u fait correspondre / est un mor- 
phisme du groupe affine GA(A) dans le 
groupe linéaire GL(E). 

4. Soit A et B deux espaces affines de 
dimensions finies (dim A = q). Pour défi- 
nir une application affine de A dans B, il 
suffit de se donner (q 1) points affine- 
ment indépendants dans A et leurs images 
dans B. 

JACQUES MEYER 


AFFINES ESPACE & REPÈRE 


D ans la conception intuitive de 
l’espace usuel, il n’y a pas d’origine 
privilégiée ; c’est une fois qu’une origine 
est choisie que cet espace devient un 
espace vectoriel. La structure d’espace 
affine formalise cette situation à partir de 
la notion de translation associée à un 
vecteur d’extrémités données, défini 
comme bipoint. Plus précisément, la struc- 
ture affine se définit comme suit. 

Espace affine. Soit E un espace vectoriel 
sur un corps commutatif K. Un ensemble 
A est dit espace attaché à l’espace E s’il est 
muni d’une application de A X E dans A, 
notée (M, x ) ► M + x, telle que le groupe 
additif de E opère simplement transitive- 
ment sur A, le. telle que à (M, x) G A X E 
correspond un point N de A et un seul, tel 
que N = M + x ; et à un couple quelcon- 
que de points (M, N) de A X A, que l’on 
désigne sous le nom de bipoint, corres- 
pond dans E un vecteur x (appelé opéra- 
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teur de translation de A) et un seul, te l que 
N = M .y. Ce vecteur x se note MN. 
Deux bipo ints AB et CD sont dits équi- 
pollents si AB = CD. 

Soit O un point quelconque de A. Le 
couple (A, O) s’appelle espace affine muni 
de l’origine O. L’applicatio n de A dans E, 
définie par M *—> ► x — OM, est une 
bijection qui permet d’identifier l’espace A 
muni de l’origine O à l’espace vectoriel E. 

Réciproquement, par l’application qui 
à tout couple de vecteurs (x, y) de E associe 
le vecteur x + y , l’ensemble E devient un 
espace affine attaché à l’espace vectoriel E. 
Le vecteur nul de E s’appelle origine 
canonique de l’espace affine E. 

Si l’espace E est de dimension finie, on 
pose dim (A) = dim (E). 

Variété linéaire affine. Un sous- 
ensemble A' C A est appelé variété linéaire 
affine (ou variété linéaire) de l’espace 
affine A si, pour toute famille finie de 
points de A', tout barycentre de ces points 
appartient à A'. Une condition nécessaire 
et suffisante pour qu’une partie non vide A' 
de A soit une variété linéaire affine est que, 
en prenant un point O q uelcon que dans A', 
l’ensemble des vecteurs OM, où M G A', 
soit un sous-espace vectoriel E' de l’espace 
vectoriel E auquel est attaché A. Le 
sous-espace E' ne dépend d’ailleurs pas du 
choix de O dans A'. D’autre part, on peut 
montrer que la variété linéaire A' est un 
espace affine attaché à E' (qui est appelé 
direction de A'). Si E' est de dimension 
finie, on pose : dim (A') = dim (E'). Étant 
donné un sous-ensemble B de A, on 
appelle variété linéaire affine engendrée 
par B la plus petite variété linéaire conte- 
nant B ; on montre que c’est l’intersection 
de toutes les variétés contenant B. D’autre 
part, la variété linéaire affine engendrée 
par (k + 1) points de A notés (a,), pour 
1 < / ^ k 1, est l’ensemble des 


barycentres des a { . Par définition, les 
(&+1) points a } sont dits affinement 
indépendant (ou forment une famille affi- 
nement libre) si la dimension de la variété 
linéaire qu’ils engendrent est égale à k ; si 
cette dimension est inférieure à k , ils sont 
dits affinement liés. 

Repère affine . On appelle repère affine 
d’un espace affine A attaché à un espace 
vectoriel E de dimension n la donnée d’un 
point O de A et d’une base th de E. Le 
point O est l’origine du repère et les 
coordonnée s d’un point M sont les com- 
posantes de OM sur la base JL Ainsi, si : 

& = («,), 

pour 1 ^ ^ et si : 

n 

om = 

i = i 

les coordonnées de M sont les x r 

Géométrie affine . La géométrie affine 
est l’étude des espaces affines et des 
variétés linéaires affines ainsi que des 
invariants par le groupe affine. 

JACQUES MEYER 


ALGÈBRE 


L y algèbre au sens moderne, à savoir 
l’étude des structures algébriques 
indépendamment de leurs réalisations 
concrètes, ne s’est dégagée que très pro- 
gressivement au cours du xix e siècle, en 
liaison avec le mouvement général d’axio- 
matisation de l’ensemble des mathémati- 
ques et la préoccupation croissante des 
mathématiciens de « substituer les idées au 
calcul » ; jusqu’alors, le propos essentiel de 
l’algèbre avait été la résolution, par des 
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formules explicites, des équations algébri- 
ques. Les tentatives infructueuses pour 
résoudre les équations générales de degré 
supérieur ou égal à cinq, ainsi que les 
problèmes de la théorie des nombres, 
conduisirent alors les mathématiciens à 
introduire des êtres mathématiques de 
nature nouvelle qui présentaient entre eux 
des analogies étroites dans leur maniement 
et par suite à ressentir le besoin de dégager 
ce qui pouvait être commun à toutes ces 
situations. Ils furent ainsi amenés à penser 
que la « nature » des objets mathématiques 
étudiés est au fond secondaire, et le 
mathématicien anglais George Boole pou- 
vait déclarer en 1 847 : « La mathématique 
traite les opérations considérées en elles- 
mêmes, indépendamment des matières 
diverses auxquelles elles peuvent être appli- 
quées. » 

Tout au long du xix e siècle va se 
développer ce processus d’axiomatisation 
de l’algèbre qui aboutit aux structures 
actuelles. Si, dès 1850, les mathématiciens 
anglais ont dégagé avec une parfaite net- 
teté la notion de loi de composition et 
l’appliquent à des situations variées (vec- 
teurs, matrices, algèbre de la logique), il 
faudra attendre 1910 pour trouver dans la 
vaste synthèse de Steinitz l’exposé abstrait 
qui marque le début de l’algèbre moderne 
proprement dite. 

L’étude des groupes domine tout 
d’abord les préoccupations de cette épo- 
que ; introduite par Cauchy et surtout mise 
en évidence par Galois qui en a montré 
l’importance dans la théorie des équations, 
cette notion va jouer un rôle essentiel dans 
presque tous les domaines des mathéma- 
tiques, en physique et en mécanique quan- 
tique. Les travaux des mathématiciens 
allemands sur les nombres algébriques 
seront à l’origine de l’étude des corps 
et des anneaux commutatifs et ces 


notions apparaîtront comme les outils 
essentiels pour étudier les courbes et sur- 
faces algébriques, conduisant à la géomé- 
trie algébrique abstraite ; ainsi s’introduit 
le langage géométrique en algèbre com- 
mutative. L’algèbre linéaire prend une 
grande importance lorsqu’après une axio- 
matisation convenable les mathématiciens 
s’aperçoivent du caractère linéaire de nom- 
breuses situations et de l’importance du 
processus de linéarisation. Et comme « la 
mathématique est un organisme dont la 
force vitale a pour condition l’indissoluble 
union de ses parties » (Hilbert, Conclusion 
de la conférence de 1900), l’algèbre a 
rejoint avec succès l’analyse par la consi- 
dération simultanée, sur un même ensem- 
ble, de structures algébriques et topologi- 
ques (constituant ainsi la branche des 
mathématiques appelée algèbre topo- 
logique). 


1 . La théorie des groupes 

La structure de groupe 

La structure de groupe est une des struc- 
tures algébriques les plus simples et, sans 
conteste, la plus importante des mathéma- 
tiques modernes. Son universalité ne 
s’arrête pas là : le psychologue Piaget a mis 
en évidence le rôle essentiel joué par cette 
notion dans les mécanismes mêmes de la 
pensée, et H. Poincaré a pu dire que la 
notion de groupe préexiste dans notre 
esprit car la géométrie ne se concevrait pas 
sans elle. Cependant, il a fallu presque un 
siècle pour que se dégage sous forme 
abstraite cette notion. 

Axiomatiquement, un groupe est un 
ensemble muni d’une loi de composition 
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interne (x, y)^x*y associative [c’est-à- 
dire {x*y)*z = x*(y*z)] telle qu’il existe un 
élément privilégié e , appelé élément neu- 
tre, tel que x*e = e*x — x et telle que tout 
élément ait un inverse (c’est-à-dire pour 
tout x il existe un élément y tel que 
x*y = y* x = e). Un tel groupe est dit 
abélien, ou commutatif, si x*y = y*x. 

Les ensembles usuels de nombres 
(entiers relatifs, nombres rationnels, nom- 
bres complexes) sont des groupes abéliens 
pour l’addition ; les ensembles des nom- 
bres rationnels non nuis, ou réels non nuis, 
sont des groupes abéliens pour la multi- 
plication. Un important exemple de 
groupe non commutatif est celui des trans- 
formations de notre espace usuel à trois 
dimensions qui conservent la distance de 
deux points (ce sont les déplacements). 
Elles constituent un groupe non abélien si 
on convient que le produit S * T de deux 
transformations S et T est la transforma- 
tion obtenue en effectuant successivement 
la transformation T puis la transforma- 
tion S. 

Les groupes finis 

Le premier exemple de groupe formé 
d’éléments de nature assez différente de 
celle des nombres est fourni par les travaux 
de Gauss sur les formes quadratiques 
ax l + bxy -j- ty 2 , où a , b , c sont des entiers 
relatifs premiers entre eux. Deux telles 
formes étant dites équivalentes si l’on 
passe de l’une à l’autre par un changement 
de variable x' = px + qy et ÿ — rx + sy, 
où p , q , r, s sont des entiers relatifs tels que 
ps — qr = 1 , Gauss définit sur l’ensemble 
des classes de formes, de discriminant 
D — b 2 — 4 ac donné, une loi de compo- 
sition qui en fait un groupe abélien fini. 
Dans ses Disquisitiones arithmeticae de 
1801, Gauss rencontre également d’autres 
groupes finis tels que le groupe additif des 


entiers modulo un entier m ou le groupe 
multiplicatif des racines m-ièmes de l’unité 
dans le corps des nombres complexes, mais 
la notion de groupe n’apparaît pas formu- 
lée avec netteté avant Cauchy. En 1830, 
dans ses travaux sur la résolubilité des 
équations algébriques, Galois ramène 
l’étude d’une telle équation à celle du 
groupe (fini) de permutations de ses raci- 
nes ; à ce propos, l’auteur introduit les 
notions fondamentales de sous-groupe dis- 
tingué et de suite normale. Les groupes 
finis, et plus précisément les groupes de 
permutations, vont être l’objet presque 
exclusif de la théorie des groupes pendant 
de nombreuses années ; les résultats les 
plus profonds obtenus dans ce domaine au 
xix e siècle sont ceux de Jordan ( Traité des 
substitutions et des équations algébriques , 
Paris, 1 870) et de Sylow sur la structure des 
groupes finis. Beaucoup plus récemment, 
en liaison avec des préoccupations d’arith- 
métique et de géométrie algébrique, la 
théorie des groupes finis a connu un 
nouvel essor ; les découvertes les plus 
spectaculaires de ces dernières années sont 
surtout relatives aux caractères et aux 
représentations linéaires de ces groupes : 
travaux de Brauer, Chevalley, Feit- 
Thomson, Novikov (cf. groupes finis et 
représentation linéaire des groupes). 

Groupes et géométrie 

C’est à Jordan que remonte la première 
étude de groupes contenant une infinité 
d’éléments, notion qui allait prendre une 
importance considérable durant la deu- 
xième moitié du xix c siècle. En liaison avec 
le renouveau des études géométriques et 
les préoccupations axiomatiques de cette 
époque, la notion de groupe de transfor- 
mation va prendre un essor considérable 
avec l’étude systématique des invariants 
d’un tel groupe, Le. l’étude des propriétés 
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qui ne sont pas modifiées par les transfor- 
mations du groupe. Ainsi, dans notre 
espace usuel à trois dimensions, les angles 
et les distances ne sont pas changés par un 
déplacement, les angles et les rapports de 
longueurs restent invariants par une simi- 
litude, la notion de parallélisme ou la 
nature d’une conique sont invariantes par 
une transformation linéaire régulière des 
coordonnées. C’est F. Klein, dans son 
célèbre « programme d’Erlangen », de 
1872, qui dégagera un principe général, 
que nous énoncerons sous une forme 
volontairement vague et intuitive : la 
donnée d’un espace et d’un groupe de 
transformations opérant sur cet espace 
définit une « géométrie », qui est l’étude 
des propriétés qui restent invariantes 
lorsqu’on applique les transformations du 
groupe. Ainsi, la géométrie métrique (resp. 
affine, resp. projective) est l’étude des 
propriétés invariantes par le groupe ortho- 
gonal (resp. affine, resp. projectif) et cette 
théorie constitue un langage commun qui 
englobe à la fois les géométries euclidien- 
nes et non euclidiennes construites à cette 
époque (cf. groupes classiques, géomé- 
trie) ; la théorie de la relativité allait attirer 
l’attention sur la géométrie construite à 
partir du groupe de Lorentz, qui joue un 
rôle essentiel dans les théories quantiques. 

Les travaux de Klein allaient également 
mettre en évidence la notion des groupes 
isomorphes : en 1877, Klein découvre que 
le groupe de permutation des racines de 
l’équation du cinquième degré est substan- 
tiellement identique au groupe des trans- 
formations du polyèdre régulier appelé 
icosaèdre ; bien que techniquement cette 
notion de groupes isomorphes ait été 
utilisée par Galois et même Gauss dans des 
cas particuliers, elle n’apparaît sous forme 
générale qu’à cette époque. En fait, ce n’est 
que beaucoup plus récemment que la 


notion d’isomorphisme a pris toute sa 
valeur, avec les développements de l’axio- 
matique mettant en évidence le fait que 
toute structure porte en elle une notion 
d’isomorphisme. Cette « identification » 
des groupes isomorphes allait conduire à la 
théorie de la représentation linéaire des 
groupes, qui est la recherche et l’étude de 
groupes de matrices isomorphes (ou, à 
défaut, homomorphes) à un groupe donné. 

Les travaux précédents sur la géométrie 
avaient mis en évidence l’importance des 
« groupes continus » ; sous l’action de 
S. Lie et de ses élèves, puis de E. Cartan, 
cette notion allait être le germe d’une des 
théories les plus centrales des mathémati- 
ques contemporaines : la théorie des grou- 
pes de Lie (cf. groupes - Groupes de Lie), 
tandis que l’exemple des groupes classi- 
ques conduisait à la théorie des groupes 
algébriques qui admet d’importantes appli- 
cations en géométrie algébrique et en 
théorie moderne des nombres. 


2. Les origines 
de l'algèbre commutative 

Corps et anneaux 

L’étude des corps et des anneaux trouve 
son origine dans les travaux de l’école 
allemande du xix e siècle, principalement 
ceux de Kummer, Kronecker, Dedekind et 
Hilbert. Au départ, les motivations sont ici 
essentiellement la théorie des équations 
puis la théorie arithmétique des nombres 
algébriques, qui découle de recherches 
relatives au théorème de Fermât ; plus 
tardivement, et jusqu’à l’époque contem- 
poraine, la géométrie algébrique a été 
également une source d’idées essentielles. 

La notion d 'anneau dégage sous forme 
abstraite les analogies constatées par exem- 
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pie dans le maniement des nombres entiers 
relatifs et des polynômes : un anneau est un 
ensemble muni de deux lois de composi- 
tion internes : 

{x,y)^x + y et (x,y)^xy, 

appelées addition et multiplication respec- 
tivement, telles que la première soit une loi 
de groupe abélien et que la seconde soit 
associative (Le. ( xy)z = x(yz)) ; on impose 
de plus les conditions suivantes de distri- 
butivité entre les deux lois : 

x(y + z) = xy + xz et (y + z)x — yx - f- zx, 

pour x, y, 2 quelconques dans l’anneau. Il 
est commode de supposer l’existence d’un 
élément unité pour la multiplication. Lors- 
que, comme dans le cas des nombres 
rationnels par exemple, l’ensemble des 
éléments distincts de l’élément neutre pour 
la première loi (noté 0) est un groupe pour 
la seconde loi, on dit que l’anneau est un 
corps. Ici on considérera seulement le cas 
où la multiplication est commutative, en 
renvoyant à la fin du chapitre 3 le cas non 
commutatif. 

La théorie des corps 

Les premiers exemples de corps non tri- 
viaux ont été introduits par la théorie des 
équations. Les travaux de Gauss avaient 
familiarisé les mathématiciens avec le 
maniement des nombres complexes et 
Abel, puis Galois, dégagent l’idée 
d’adjonction : ils considèrent les corps 
engendrés par les racines ou les coefficients 
(indéterminés) d’une équation mais, en 
fait, si ces auteurs définissent avec préci- 
sion l’appartenance d’une quantité à un tel 
corps, ils ne considèrent pas explicitement 
l’ensemble ainsi constitué. Il faut attendre 
Dedekind (qui introduit le mot corps) pour 
une étude systématique de certains corps 
d’un type assez général, les corps de 


nombres algébriques ; ce sont des corps 
Q(0) obtenus de la façon suivante : si 0 est 
un nombre complexe racine d’une équa- 
tion / (x) = 0 de degré n , à coefficients 
entiers, irréductible sur le corps Q des 
nombres rationnels, on appelle Q(0) 
l’ensemble, qui est un corps, des nombres 
complexes a 0 + a fi ... + a n _fî n 1 où 
les a, sont des nombres rationnels quel- 
conques. 

Tous les corps de nombres algébriques 
sont des sous-corps du corps des nombres 
complexes ; reprenant une idée de Cauchy 
qui définissait les nombres complexes 
comme classes résiduelles de polynômes à 
coefficients réels modulo le polynôme 
x 2 -f- 1 , Kronecker donne, en 1882, les 
premiers exemples de corps (non triviaux) 
définis abstraitement en montrant que, 
avec les notations ci-dessus, le corps Q(0) 
est isomorphe au corps des classes rési- 
duelles de polynômes à coefficients ration- 
nels modulo le polynôme /(x). Vers la 
même époque, Dedekind et Weber font 
rentrer dans la théorie des corps le calcul 
des congruences modulo un nombre pre- 
mier (mettant ainsi en évidence les pre- 
miers corps finis, déjà étudiés par Galois) 
et donnent une première esquisse d’une 
théorie axiomatique des corps. 

À la fin du xix e siècle, les exemples de 
corps définis abstraitement vont se multi- 
plier. Il faut citer surtout les corps de 
nombres /sadiques, introduits par Hensel 
et dont l’importance dans de nombreuses 
branches des mathématiques est considé- 
rable, et les corps de séries formelles, 
introduits par Véronèse en liaison avec des 
préoccupations de géométrie algébrique. 
Tous ces exemples allaient conduire Stei- 
nitz, en 1910, à développer systématique- 
ment la théorie des corps et de leurs 
extensions sous la forme qu’elle possède 
actuellement. 
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La théorie des idéaux 

À l’origine de la théorie des anneaux, on 
trouve essentiellement des recherches de 
théorie des nombres. En 1831, Gauss avait 
été amené, à propos de ses célèbres recher- 
ches sur les résidus biquadratiques, à 
étudier des propriétés de divisibilité dans 
l’anneau Z [/] des « entiers de Gauss » de la 
forme a -}- bi, a et b entiers relatifs et 
/ 2 = — 1 ; il avait constaté une parfaite 
analogie avec les propriétés correspondan- 
tes de l’anneau Z des entiers rationnels, ce 
qui s’explique, dans le langage moderne, 
par le fait que ces deux anneaux sont 
principaux. Les travaux de Kummer sur le 
grand théorème de Fermât allaient faire 
apparaître des anneaux pour lesquels la 
situation est souvent très différente ; il 
s’agit des anneaux cyclotomiques ainsi 
définis : p étant un nombre premier et t 
étant une racine primitive p-ième de 
l’unité, on appelle Z [C] l’ensemble, qui 
forme un anneau, des combinaisons linéai- 
res à coefficients entiers de puissances de 
C. Comme on le sait, le théorème de 
Fermât affirme que la relation : 

XP + yp = zP 

est impossible pour x, y, z entiers non nuis 
et p entier supérieur ou égal à trois ; en fait, 
on voit facilement qu’on peut se borner à 
établir cette impossibilité pour p premier 
> 3. Il est probable que la « démonstra- 
tion » de Fermât utilisait implicitement le 
fait, erroné dans le cas général, que, 
comme dans l’anneau Z, tout élément de 
l’anneau Z [C] s’écrit de manière unique (à 
un élément inversible dans l’anneau près) 
comme produit d’éléments premiers. En 
1845, après huit ans d’efforts, Kummer 
en introduisant ses « nombres idéaux » 
(qu on appelle maintenant des diviseurs) 
élucide complètement le problème de la 
division dans ies anneaux cyclotomiques et 


démontre le théorème de Fermât dans de 
très nombreux cas. 

L’idée de Kummer est en gros la 
suivante : soit a* un élément de l’anneau 
Z [C] qui admet deux décompositions dif- 
férentes, soit, pour simplifier : 

x = x } x 2 et x = * 3 .x 4 

où les éléments xq, x 2 , x 3 , x 4 sont tous 
premiers ; on suppose de plus que ces deux 
décompositions ne diffèrent pas seulement 
par un élément inversible. Kummer 
démontre qu’on peut représenter les élé- 
ments non nuis de l’anneau considéré 
comme objets d’un nouvel ensemble muni 
d’une multiplication et dans lequel la 
décomposition en facteurs premiers est 
cette fois définie de manière unique. Ainsi, 
pour tout élément x ^0 de Z [C], son 
image (a), sera décomposable de manière 
unique en facteurs premiers « idéaux », 
mais ces facteurs premiers ne sont pas 
nécessairement les images de certains élé- 
ments de l’anneau Z [C] ; de même, un 
élément premier de l’anneau Z [Ç] n’a pas 
nécessairement pour image un « nombre 
idéal » premier. L’existence de deux 
décompositions distinctes rencontrées 
ci-dessus pour x s’explique ainsi : il existe 
des « nombres idéaux » p h p 2 , p 2 , p 4 tels 
que : 

(*l) = P \P 2) (*2) = PlP*, 

(* 3 ) — p 1 P 2 > (* 4 ) =PzP+ 

et les deux décompositions de x s’écrivent : 

(*) ~ P \P 2 ’ P 2 P 4 =PlP2‘P2P* 

qui diffèrent seulement par l’ordre des 
facteurs. 

La notion d’idéal d’un anneau, sous 
groupe additif qui est stable par multipli- 
cation par un élément quelconque de 
l’anneau, a été introduite, en liaison avec 
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les travaux de Kummer, par Dedekind 
dans le cas des anneaux d’entiers algébri- 
ques (cf. infra). Dedekind montra que les 
« nombres idéaux » peuvent être représen- 
tés par les idéaux de l’anneau, donnant 
ainsi un exemple de loi de composition 
entre ensembles d’éléments. En général, 
un idéal n’est pas inversible pour la loi de 
composition ainsi définie ; par symétrisa- 
tion de cette loi, on introduit les idéaux 
fractionnaires qui sont importants en théo- 
rie des nombres et en géométrie algébri- 
que. 

Les anneaux auxquels on peut généra- 
liser la théorie de Kummer ont été étudiés 
systématiquement à l’époque contempo- 
raine, conduisant à la notion générale 
d’anneau de Dedekind. Un outil essentiel 
est ici la notion de valuation d’un corps 
introduite sous forme générale par Krull 
en 1931 mais déjà utilisée antérieurement 
dans des cas particuliers, par Ostrowski 
notamment ; les idéaux premiers d’un 
anneau de Dedekind sont en correspon- 
dance biunivoque avec les classes de valua- 
tions équivalentes du corps des fractions 
de cet anneau. 

Eléments entiers 

L’étude arithmétique systématique des 
corps de nombres algébriques n’était pos- 
sible qu’en introduisant une notion d’élé- 
ment entier jouant, pour un tel corps, le 
même rôle que les entiers usuels pour le 
corps des nombres rationnels. Les progrès 
dans ce domaine furent réalisés à peu près 
simultanément et indépendamment par 
Kronecker et Dedekind pendant la 
seconde moitié du xix e siècle. La notion 
d'entier algébrique est due à Dedekind : un 
nombre complexe est un entier algébrique 
s’il est racine d’un polynôme à coefficients 
entiers rationnels dont le coefficient du 
terme dominant est égal à 1 ; les entiers 


algébriques d’un corps K de nombres 
algébriques forment un anneau, que Dede- 
kind appelle un ordre (le mot anneau est 
de Hilbert). Dans un théorème célèbre et 
profond, Dirichlet décrit complètement le 
groupe multiplicatif des éléments inversi- 
bles de l’anneau des entiers d’un corps de 
nombres algébriques et ce résultat a 
d’importantes applications arithmétiques, 
notamment dans l’étude des représenta- 
tions des nombres entiers par des formes 
quadratiques. 

Plus généralement, si A est un anneau 
contenu dans un corps K, on peut définir 
les éléments du corps qui sont entiers sur 
A ; un tel anneau A est dit « intégralement 
clos » s’il est égal à l’ensemble des éléments 
de son corps des fractions qui sont entiers 
sur lui. Ces anneaux ont pris une grande 
importance en géométrie algébrique 
contemporaine depuis que Zariski et ses 
élèves ont mis en évidence l’intérêt des 
variétés algébriques dites normales, qui 
possèdent la propriété qu’en chacun de 
leurs points l’anneau des fonctions ration- 
nelles définies en ce point est intégralement 
clos. 

Géométrie algébrique 
et algèbre commutative 

Il n’est pas question même d’esquisser ici 
l’histoire de la géométrie algébrique, qui 
était au départ l’étude des courbes algé- 
briques, et qui, sous sa forme actuelle, la 
théorie des schémas, due au mathémati- 
cien français A. Grothendieck, est devenue 
une des branches les plus abstraites et les 
plus vivantes des mathématiques contem- 
poraines ; nous essayerons seulement de 
montrer, de manière d’ailleurs bien incom- 
plète, comment les premiers besoins de 
cette science ont conduit à l’introduction et 
à l’étude axiomatique de nouveaux types 
d’anneaux. 
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À l’origine, le propos de la géométrie 
algébrique était essentiellement l’étude des 
courbes dans le plan projectif complexe et 
la théorie des « fonctions algébriques », 
développée par Weierstrass et Riemann à 
partir des travaux d’Abel et Jacobi, utilisait 
presque uniquement des méthodes trans- 
cendantes. Avec Riemann et Dedekind, le 
centre d’intérêt se porte sur l’anneau des 
fonctions rationnelles partout définies 
(sauf à l’infini) ; les mathématiciens décou- 
vrent alors que les propriétés géométriques 
de la courbe se reflètent dans cet anneau et 
que l’étude de ces anneaux et l’étude 
géométrique vont de pair. 

Hilbert, dans ses travaux sur les anneaux 
de polynômes à plusieurs variables, dégage 
le fait important que tous les idéaux de ces 
anneaux sont engendrés par un nombre fini 
d’éléments. Ces conditions de finitude 
allaient prendre un grande importance 
avec les travaux de la mathématicienne 
allemande E. Noether qui, vers 1920, étu- 
die systématiquement ces anneaux (appelés 
actuellement anneaux noethériens). La 
géométrie algébrique s’étant progressive- 
ment débarrassée, pendant la première 
moitié du xx e siècle, de toute hypothèse sur 
le corps de base et la nature des singulari- 
tés, on peut dire, depuis 1 940 environ, que 
tout résultat relatif aux anneaux noethé- 
riens a une interprétation « géométrique » 
dans ce cadre. Dans cet ordre d’idée, 
signalons par exemple un résultat impor- 
tant : bien que la théorie de Kummer ne soit 
pas valable pour l’anneau des polynômes à 
n variables sur un corps K, on peut cepen- 
dant associer à tout idéal de cet anneau un 
ensemble bien déterminé d’idéaux pre- 
miers et ceux de ces idéaux premiers qui 
sont minimaux correspondent aux compo- 
santes irréductibles de l’ensemble défini 
dans K" par l’annulation des polynômes de 
l’idéal. Par ailleurs, on peut ici encore 


donner des théorèmes de « décomposi- 
tion » des idéaux en introduisant des 
notions nouvelles qui dépasseraient le 
cadre de cet article (« décomposition pri- 
maire » ; cf. ANNEAUX COMMUTATIFS). 
Signalons pour terminer que la notion de 
dimension, directement issue de la géomé- 
trie algébrique, a été convenablement axio- 
matisée pour des anneaux commutatifs très 
généraux et est étudiée de manière abstraite 
dans ces anneaux. 

Anneaux locaux et localisation 

L’anneau Z {p) des nombres rationnels dont 
le dénominateur n’est pas divisible par un 
nombre premier /?, ou l’anneau des germes 
de fonctions holomorphes dans un voisi- 
nage de l’origine du plan complexe, pos- 
sèdent une propriété commune : il existe 
un idéal de cet anneau qui est distinct de 
l’anneau et qui contient tous les autres 
idéaux distincts de l’anneau (dans le pre- 
mier cas, c’est l’ensemble des nombres 
rationnels dont le numérateur est divisible 
par p sans que le dénominateur le soit et, 
dans le second cas, l’ensemble des germes 
des fonctions considérées qui s’annulent à 
l’origine). De manière générale, on appelle 
anneau local tout anneau possédant cette 
propriété, et on étudie ces anneaux sous 
forme abstraite ; l’intérêt de cette notion 
est qu’elle inclut en particulier tous les 
anneaux de germes de fonctions (ration- 
nelles, différentiables ou analytiques) que 
l’on rencontre dans la théorie des variétés 
algébriques, différentiables ou analytiques. 
En liaison avec la notion de valuation dont 
une des applications a déjà été signalée 
ci-dessus, un autre exemple important 
d’anneau local est constitué par les 
anneaux de valuation : un sous-anneau A 
d’un corps K, qui est distinct de K, est 
appelé un anneau de valuation de K si, 
pour tout jc ^ 0 qui n’appartient pas à A, 
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son inverse x appartient à A ; ces anneaux 
correspondent à l’ensemble des éléments 
de K où une valuation de K prend des 
valeurs supérieures à 1. 

Reprenons l’exemple de l’anneau lL {p) 
ci-dessus pour expliquer dans un cas parti- 
culier la méthode générale de localisation. 
Considérons une équation diophantienne : 

P(x lf = 0, 

où P est un polynôme à coefficients entiers 
rationnels. Pour trouver les solutions entiè- 
res de cette équation, on peut d’abord cher- 
cher les solutions qui appartiennent au 
corps des quotients Q de l’anneau Z, puis, 
dans une seconde étape, les solutions 
rationnelles dont le dénominateur n’est pas 
divisible par un nombre premier p , i. e. les 
solutions qui appartiennent à l’anneau Z^j, 
appelé l’anneau local de Z qui correspond 
au nombre premier p . Bien entendu, si 
l’équation considérée à une solution dans 
Z, cette solution appartiendra à tous les 
anneaux locaux Z^. Dans le cas d’un 
anneau général A, on peut de même résou- 
dre le problème posé dans les anneaux 
locaux correspondant aux idéaux premiers 
de Panneau. La résolubilité de l’équation 
dans chacun des anneaux locaux (localisa- 
tion) est une condition nécessaire d’exis- 
tence d’une solution dans Panneau A. 
L’étude de la suffisance de ces conditions 
(en nombre infini dans le cas général) 
s’appelle la globalisation ; signalons tout de 
suite qu’en général la globalisation n’est pas 
possible sous la forme indiquée ci-dessus. 

3. L'algèbre linéaire et les origines 
de l'algèbre non commutative 

Structures linéaires 

L’étude des équations et systèmes d’équa- 
tions du premier degré était reléguée au 


début du xix e siècle dans l’enseignement 
élémentaire et négligée des mathémati- 
ciens, lorsqu’une axiomatisation convena- 
ble montra la puissance des notions nou- 
velles ainsi mises en évidence. Sous sa 
forme actuelle, l’algèbre linéaire est une 
remarquable synthèse conduisant à un 
vocabulaire et à des résultats qui s’appli- 
quent presque universellement dans tous 
les domaines des mathématiques et de la 
physique contemporaine, tandis que le 
processus de « linéarisation » apparaît 
comme essentiel dans de nombreuses bran- 
ches des mathématiques pures et appli- 
quées. La notion fondamentale est ici celle 
d’espace vectoriel ; elle généralise les pro- 
priétés de l’ensemble des vecteurs de notre 
espace à trois dimensions. Un espace 
vectoriel E sur un corps K est un ensemble 
d’éléments, appelés « vecteurs », muni 
d’une loi de groupe abélien notée additi- 
vement et d’une loi externe qui à tout 
couple (a, x ) d’un élément a du corps K et 
d’un vecteur x de E fait correspondre un 
vecteur eue de E de telle sorte que l’on ait : 

a.{b.x) = (ab)jc, pour a, b dans K et x dans E ; 
Ijc — x, pour tout x de E (1 est l’élément neutre 
de K pour la multiplication) ; 

(a + b) . x = a.x + b.x, pour a , b dans K et x 
dans E ; 

a.(x H- y) = a.x + b. y, pour a dans K et x,y dans 
E. 

Les applications d’un tel espace vecto- 
riel E dans un autre qui respectent la 
structure d’espace vectoriel, Le. telles que : 

f{x +y) =/(*) +/O0,/(a -x) = «■/(*), 

pour a dans K et x, y dans E, sont dites 
linéaires . 

Une algèbre E sur un corps K est un 
K-espace vectoriel E muni d’un « pro- 
duit » qui est une loi E X E — ► E linéaire 
par rapport à chaque facteur (on dit 
bilinéaire). Si cette loi est associative, 
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et admet un élément unité, on a une 
structure d’anneau. 

Par exemple, les nombres complexes 
forment une algèbre sur le corps des 
nombres réels. 

Espaces de dimension finie 

La représentation géométrique des nom- 
bres complexes introduite par Argand 
l’avait amené implicitement à définir 
l’addition des vecteurs du plan ; plus géné- 
ralement, la nécessité d’un calcul de nature 
« géométrique », ou « intrinsèque » (Le. 
indépendant du choix du système d’axes de 
coordonnées), allait conduire Grassmann, 
Môbius et Hamilton à dégager durant la 
première moitité du xix e siècle, les règles 
du calcul vectoriel et, presque simultané- 
ment, à généraliser les propriétés de 
l’espace « usuel » à deux ou trois dimen- 
sions en introduisant des espaces de 
dimension supérieure. Ces derniers appa- 
raissent tout d’abord comme un langage 
géométrique commode pour interpréter 
des résultats algébriques valables sans 
modification pour un nombre quelconque 
de variables et susceptibles d’une interpré- 
tation géométrique dans le cas de deux ou 
trois variables. Grassmann définit, de 
manière déjà presque axiomatique, les 
espaces à n dimensions, l’addition des 
vecteurs, l’indépendance d’un système de 
vecteurs, étudie la dimension des sous- 
espaces vectoriels, sans recours aux coor- 
données, et construit l’algèbre extérieure 
d’un espace vectoriel. Dans ce cadre allait 
s’insérer tout naturellement l’étude géné- 
rale des systèmes d’équations linéaires : la 
notion de rang d’un tel système est dégagée 
par Frobenius et les résultats généraux 
sont obtenus par Kronecker ; en liaison 
avec ces préoccupations, Kronecker et 
Weierstrass donneront une définition axio- 
matique des déterminants, déjà connus 


depuis le xvm e siècle et que Grassmann 
avait rattachés à son calcul extérieur. Les 
concepts généraux d’algèbre linéaire et 
multilinéaire relatifs aux espaces vectoriels 
de dimension finie sont précisés rapide- 
ment et on assiste successivement à l’éla- 
boration du calcul matriciel par Cayley et 
à l’introduction du produit tensoriel par 
Kronecker ; cependant tous les travaux des 
mathématiciens de cette époque restent 
truffés d’hallucinants calculs où les déter- 
minants jouent un rôle essentiel et le 
caractère intrinsèque des éléments qui 
interviennent est souvent peu visible. 

En liaison avec le renouveau de la 
géométrie, la notion de dualité se dégage 
peu à peu pour les espaces vectoriels, 
mettant en évidence la notion de variables 
« cogrédientes » ou « contragrédientes », 
c’est-à-dire variant dans un espace vecto- 
riel ou dans l’espace vectoriel dual. L’étude 
des coniques et des quadriques, ainsi que 
de nombreuses recherches arithmétiques 
avaient mis en vedette les formes quadra- 
tiques à 2, 3 puis n variables et les formes 
bilinéaires qui leur sont associées ; la 
théorie des invariants, créée par Cayley, 
Hermite et Sylvester, introduit systémati- 
quement des formes multilinéaires à plu- 
sieurs séries de variables cogrédientes et 
contragrédientes, ce qui, aux notations 
près, revient à définir des tenseurs. En 
liaison avec la géométrie différentielle, ces 
travaux allaient conduire, au début du 
xx e siècle, Ricci et Levi-Civita à construire 
le calcul tensoriel et Poincaré et É. Cartan 
le calcul différentiel extérieur, issu direc- 
tement de la multiplication extérieure de 
Grassmann. 

Axiomatisation 
de l'algèbre linéaire 

Dès 1888, Peano avait donné une défini- 
tion axiomatique des espaces vectoriels 
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généraux (sur le corps des nombres réels) 
et des applications linéaires dans ces espa- 
ces, mais c’est l’analyse qui fournit les plus 
importants exemples d’espaces vectoriels 
de dimension infinie et conduisit à saisir 
toute la portée de l’algèbre linéaire. À 
propos de recherches sur les équations 
différentielles et surtout les équations aux 
dérivées partielles, Hilbert introduit, à 
l’aube du xx e siècle, le célèbre espace de 
Schmidt et utilise systématiquement des 
techniques linéaires pour étudier les opé- 
rateurs dans cet espace (cf. espace de 
hilbert) et c’est Toeplitz, élève de Hilbert, 
qui donne la définition d’un espace vecto- 
riel sur un corps quelconque et étend à ces 
espaces de nombreux résultats d’algèbre 
linéaire en constatant qu’ils sont indépen- 
dants de la théorie des déterminants et 
subsistent sans supposer que l’espace est 
de dimension finie. Quelques années plus 
tard, Banach allait étudier systématique- 
ment les opérateurs linéaires et la dualité 
dans les espaces vectoriels de fonctions 
(cf. § 4), tandis qu’Artin, E. Noether et 
Krull allaient mettre en évidence le carac- 
tère presque entièrement linéaire de l’algè- 
bre moderne. 

À l’époque contemporaine, on s’est 
aperçu de l’intérêt qu’il y avait à généra- 
liser la notion d’espace vectoriel en rem- 
plaçant le corps de base par un anneau (pas 
nécessairement commutatif), définissant 
ainsi la notion de module (dans le cas non 
commutatif, il faut distinguer des modules 
à droite et à gauche). L’étude des modules 
sous forme abstraite s’est épanouie sous 
l'influence de S. MacLane, H. Cartan et 
S. Eilenberg pour aboutir à une branche 
nouvelle de l’algèbre, l’algèbre homologi- 
que, issue directement des problèmes 
posés par la topologie algébrique, et dont 
le but principal est l’étude des questions où 
interviennent des relations de dépendance 


linéaire entre éléments d’un module. 
L’algèbre homologique est non seulement 
devenue l’outil essentiel de la topologie 
algébrique mais est venue féconder de 
nombreux autres secteurs des mathémati- 
ques contemporaines ; sous la forme axio- 
matique que lui ont donnée H. Cartan et 
Eilenberg, cette science est également à 
l’origine de la théorie des catégories abé- 
liennes. 

Algèbres non commutatives 

Les débuts de l’algèbre non commutative 
apparaissent étroitement liés à l’élabora- 
tion de l’algèbre linéaire. Lorsque Hamil- 
ton considéra un nombre complexe a + bi 
comme un couple ordonné {a, b) de nom- 
bres réels, les opérations d’addition et de 
multiplication entre de tels couples étant 
celles qui sont déduites du calcul usuel sur 
les nombres complexes, il chercha en 
définissant une multiplication convenable, 
à étendre les propriétés du corps des 
nombres complexes à des « ternes » ou 
« quaternes », c’est-à-dire à des systèmes 
de trois ou quatre nombres réels, pour 
construire une algèbre jouant pour les 
rotations de l’espace à trois dimensions le 
même rôle que les nombres complexes 
pour les rotations planes de centre O. C’est 
ainsi qu’il construisit, vers 1845, les qua- 
ternions, premier exemple de corps dont la 
multiplication n'est pas commutative. 
C’est en essayant de généraliser sa décou- 
verte, en introduisant par exemple les 
biquaternions, que Hamilton fut amené à 
dégager le fait qu’on peut définir une 
structure d’algèbre sur un espace vectoriel 
de dimension finie en donnant la « table de 
multiplication » des éléments d'une base. 
Les matrices allaient donner de nombreux 
autres exemples d’algèbres non commuta- 
tives, mais ce n’est qu’en 1870 que 
B. Pierce donne une définition axiomati- 
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que et introduit les notions fondamentales 
relatives aux algèbres de dimension finie ; 
d’autre part, les travaux de Lie (et de son 
école) à propos des algèbres qui portent 
son nom allaient dégager la notion fonda- 
mentale de radical et E. Cartan allait 
mettre en évidence le rôle essentiel joué 
par les algèbres semi-simples. Une autre 
application très importante de l’algèbre 
non commutative est la représentation 
linéaire des groupes et algèbres, dévelop- 
pée de 1896 à 1910 par Frobenius, Burn- 
side et Schur. 


4. Algèbre topologique 

La continuité des opérations algébriques 
est d’usage courant dans l’analyse classi- 
que ; depuis le début du xix e siècle, en 
liaison avec l’introduction des nouveaux 
êtres mathématiques considérés plus haut, 
les mathématiciens allaient rencontrer 
dans de nombreux problèmes de nature 
variée des ensembles munis d’une notion 
de convergence et de lois de composition 
« continues pour cette notion de conver- 
gence ». Ce mariage fréquent de l’algèbre 
et de la topologie a conduit à étudier 
axiomatiquement ces situations, introdui- 
sant ainsi de nouvelles structures très utiles 
et très riches, qui jouent un rôle essentiel 
dans de nombreuses théories mathémati- 
ques contemporaines ; à titre d’exemple, 
on peut signaler les espaces vectoriels 
topologiques et les groupes topologiques. 

Espaces vectoriels normés 
et espaces vectoriels topologiques 

Un espace vectoriel normé sur le corps K 
des nombres réels ou des nombres com- 
plexes est un espace vectoriel E sur lequel 
est définie une fonction x — ► 1| .y ||, à valeurs 
réelles positives, possédant les propriétés 


suivantes, qui généralisent celle de la 
longueur d’un vecteur dans les espaces de 
dimension finie : 

a) || . v || = 0 si et seulement si x = 0 ; 

b) Il ■ x + y II < Il -V II + Il y ||, pour A-, y quel- 
conques dans E ; 

c) || «..y || — | a II .y ||, pour a dans K et x 
dans E. (| a | est ici la valeur absolue ou le 
module du nombre réel ou complexe a). 

La considération d’espaces « fonction- 
nels » (c’est-à-dire d’espaces vectoriels 
dont les éléments sont des fonctions) 
munis d’une norme convenable est deve- 
nue un des outils essentiel de l'analyse 
contemporaine. 

La théorie des espaces vectoriels nor- 
més s’est constituée de 1900 à 1930 
approximativement et ici encore l’espace 
de Hilbert a joué un rôle historique consi- 
dérable. Hilbert, au début du xx e siècle, fut 
amené à introduire deux notions de 
convergence différentes sur l’espace des 
suites (a*,,) de nombres réels tels que la 


série 


z 


soit convergente et étudie 


n 

la continuité de nombreuses applications 
linéaires. Quelques années plus tard, vers 
1907-1908, Schmidt, Fréchet et Riesz 
généralisent le langage de la géométrie des 
espaces de dimension finie à l’espace de 
Hilbert et introduisent la norme dans ce 
cas particulier ; la notion d’espace vecto- 
riel normé général apparaît alors vers 1920 
dans les travaux de Hahn et de Banach. 

Un des aspects essentiels des problèmes 
sur les espaces vectoriels normés est la 
théorie de la dualité topologique qui 
occupe déjà une place centrale dans les 
travaux de F. Riesz sur les espaces de 
fonctions intégrables. À partir de 1927, 
Hahn et Banach abordent de manière 
générale le problème de la dualité en 
montrant qu’on peut munir le dual d’un 
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espace normé d’une structure d’espace 
normé (complet) ; itérant cette construc- 
tion, Hahn pourra poser de manière géné- 
rale le problème des espaces réflexifs, i. e. 
qui sont isomorphes à leur bidual topolo- 
gique. Vers 1932, la théorie des espaces 
normés est à peu près achevée avec le livre 
de Banach, Théorie des opérations linéaires. 

Une notion telle que la convergence 
simple d’une suite de fonctions dans un 
espace fonctionnel n’est pas associée à une 
norme, et il était nécessaire de considérer 
sur des espaces vectoriels des notions de 
convergence plus générales que celles défi- 
nies par des normes, situation étudiée pour 
la première fois par Fréchet. Mais, sans 
hypothèse restrictive, la théorie générale 
était trop pauvre ; la notion essentielle qui 
allait permettre à la théorie de s’épanouir 
est la convexité, étudiée par Banach et ses 
élèves, conduisant von Neumann en 1935 à 
définir les espaces localement convexes. 
Des branches essentielles des mathémati- 
ques contemporaines, la théorie des distri- 
butions par exemple, utilisent de manière 
constante la théorie de ces espaces. 

Groupes topologiques 

La nécessité d’étudier des groupes « conti- 
nus » plus généraux que les groupes de 
Lie conduisit Schreier en 1927 à définir 
des groupes dits topologiques, tels que la 
multiplication et le passage à l’inverse 
soient des opérations continues. Ceux de 
ces groupes qui, comme les groupes de Lie, 
sont localement compacts possèdent des 
propriétés remarquables dont l’étude cons- 
titue une branche nouvelle de l’analyse, 
l’analyse harmonique généralisée. En 
1933, Haar démontra le théorème suivant, 
qui est le point de départ de toute la 
théorie : il existe sur un tel groupe une 
mesure qui est invariante par multiplica- 
tion à gauche par les éléments du groupe. 


À partir de ce résultat, le mathématicien 
soviétique Pontriaguine construisit sa 
théorie des caractères pour les groupes 
commutatifs localement compacts, dont 
un des aspects les plus spectaculaires est 
sans doute le théorème de dualité. 
Essayons d’expliquer ce résultat en quel- 
ques mots : un caractère d’un groupe 
topologique G est un homomorphisme 
continu de G dans le groupe multiplicatif 
des nombres complexes de module 1 ; il est 
clair que l’ensemble des caractères forme 
un groupe commutatif X et on montre que 
si G est commutatif localement compact, 
le groupe X peut être muni de manière 
naturelle d’une structure de groupe topo- 
logique localement compact. Le théorème 
de dualité s’exprime alors par le fait que le 
groupe G est isomorphe, algébriquement 
et topologiquement, au groupe des carac- 
tères du groupe X. 

Issue directement de la théorie des 
espaces de Banach, la belle théorie des 
algèbres normées (algèbres de Banach), 
développée à partir de 1 940 par le mathé- 
maticien soviétique Gelfand et ses élèves, 
allait éclairer d’un jour nouveau la dualité 
de Pontriaguine et permettre d’obtenir 
d’importants résultats sur la représenta- 
tion linéaire des groupes localement com- 
pacts généraux (et en particulier des grou- 
pes de Lie). 

JEAN-LUC VERLEY 
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ALGÈBRE DE BOOLE 

-* BOOLE ALGÈBRE 5 ANNEAU DE 


ALGÈBRE LINÉAIRE & 
MULTILINÉAIRE — LINÉAIRE 
& MULTILINÉAIRE ALGÈBRE 


ALGÈBRE TOPOLOGIQUE 
- TOPOLOGIQUE ALGÈBRE 


ALGÈBRES NORMÉES 
— NORMÉES ALGÈBRES 


ALGÉBRIQUES nombres 
— NOMBRES (THÉORIE 
DES) - Nombres algébriques 


ANALYSE COMBINATOIRE 
— COMBINATOIRE ANALYSE 


ANALYSE HARMONIQUE 
- HARMONIQUE ANALYSE 


ANNEAU DE BOOLE 

— > BOOLE ALGÈBRE S ANNEAU DE 


ANNEAUX COMMUTATIFS 

D ans tout ce qui suit, on se bornera à 
considérer des anneaux commutatifs 
unitaires, c’est-à-dire possédant un élément 
unité pour la multiplication, noté 1. Les 
définitions sont celles de l’article suivant, 

ANNEAUX ET ALGEBRES. 

De nombreux cas particuliers 
d’anneaux commutatifs unitaires ont été 
étudiés au xix e siècle, principalement 
à propos de recherches de théorie des 
nombres et de géométrie algébrique. Intro- 
duits à l’origine pour étudier la divisibilité 
dans de tels anneaux, les idéaux, cas 
particuliers de modules, se sont révélés 
essentiels dans de nombreuses questions. 
En fait, la classification des différents 



anneau 

intégralement clos ! 



anneau 

factoriel 

anneau k anneau 

de Dedekind * noetherien 

.A . 


| anneau 

principal 
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types d’anneaux s’effectue suivant la struc- 
ture de leurs idéaux. 

L’arithmétique des anneaux dits 
principaux est analogue à l’arithmétique 
des nombres entiers ou des polynômes ; 
plus généralement, on peut étudier de 
manière satisfaisante l’arithmétique des 
anneaux de Dedekind : ici, les propriétés 
de divisibilité, déroutantes a priori, s’expri- 
ment harmonieusement dans le cadre de 
la théorie des idéaux. Une autre généra- 
lisation possible des anneaux principaux, 
qui englobe d’ailleurs la précédente, est 
liée à des conditions de finitude : tout idéal 
d’un anneau principal est formé des 
multiples d’un élément ; plus générale- 
ment, on peut considérer les anneaux dans 
lesquels tout idéal est formé des combi- 
naisons linéaires (à coefficients dans 
l’anneau) d’un nombre fini d’éléments, et 
ces anneaux, appelés noethériens, possè- 
dent une remarquable propriété de stabi- 
lité, découverte par Hilbert, à savoir que 
l’anneau des polynômes sur un anneau 
noethérien est lui-même noethérien. Pour 
terminer, mentionnons ici la classe impor- 
tante des anneaux locaux , qui possèdent 
un unique idéal maximal : cela signifie qu’il 
existe un idéal propre contenant tous les 
autres idéaux propres de l’anneau ; ces 
anneaux jouent un grand rôle dans la 
théorie des variétés algébriques, différen- 
tiables ou analytiques, car les anneaux de 
germes de fonctions sont de ce type. 
L’étude des anneaux locaux est très liée à 
des considérations topologiques ; nous 
renvoyons à ce propos aux articles algèbre 
topologique et théorie des nombres 
- Nombres /sadiques. 

Le tableau ci-dessus précise les rapports 
entre ces différents anneaux, chaque flèche 
exprimant qu’une propriété en entraîne 
une autre. 


* 

1 . Notions fondamentales 
Divisibilité 

La présence dans un anneau de diviseurs 
de zéro, c’est-à-dire d’éléments a et b , tous 
deux non nuis, dont le produit est nul, rend 
illusoire toute théorie satisfaisante de la 
divisibilité. Les anneaux commutatifs sans 
diviseurs de zéro sont appelés des anneaux 
intègres ou anneaux d’intégrité. Nous 
allons, dans ce qui suit, préciser quelques 
propriétés de la divisibilité dans un tel 
anneau d’intégrité A. Dans toutes ces 
questions de divisibilité, seul intervient le 
fait que l’ensemble A* des éléments non 
nuis de l’anneau A est muni d’une loi de 
composition interne (x, y) l — ► xy (la mul- 
tiplication) associative, commutative, avec 
un élément unité ; un ensemble muni d’une 
loi possédant ces propriétés est appelé un 
monoïde. Nous énoncerons les définitions 
générales relatives à la divisibilité dans le 
cadre d’un monoïde A* quelconque, ce qui 
sera utile dans la troisième partie. 

On dit qu’un élément b de A* divise un 
élément a de A*, ou encore que a est 
divisible par b s’il existe un élément c tel que 
a = bc. II est clair que cette notion de 
divisibilité généralise la notion usuelle de 
divisibilité dans le monoïde Z* des entiers 
relatifs non nuis et possède des propriétés 
analogues : par exemple, si c divise b et si 
b divise a , alors c divise a. 

Dans toutes les questions de divisibilité, 
un rôle essentiel est joué par les unités , qui 
sont les éléments inversibles (ou encore, 
avec la terminologie ci-dessus, les éléments 
qui divisent l’élément unité 1) ; si A* est le 
monoïde des éléments non nuis d’un 
anneau d’intégrité A, ces éléments sont 
aussi appelés les unités de l’anneau : par 


26 



ANNEAUX COMMUTATIFS 


exemple, dans Tanneau Z des entiers 
relatifs, les seules imités sont les nombres 
+ 1 et — 1 et, dans l’anneau des polynô- 
mes à coefficients dans un corps K, ce sont 
les polynômes constants non nuis. Dans 
tous les cas, on vérifie facilement que les 
unités forment un groupe multiplicatif ; 
pour un anneau A, la structure de ce 
groupe est une importante caractéristique 
arithmétique de A. Deux éléments a et b , 
qui diffèrent seulement par un élément 
inversible, c’est-à-dire tels que a = ub , u 
inversible, possèdent des propriétés de 
divisibilité très analogues et sont dits 
associés. Pour terminer ces définitions, 
indiquons qu’un élément a de A* est dit 
premier , ou irréductible , s’il n’est pas inver- 
sible et si pour toute décomposition 
a — hc ; b , c éléments de A*, l’un des deux 
facteurs b ou c est inversible. Un des 
problèmes fondamentaux de la divisibilité 
dans A* est l’étude de la décomposition 
éventuelle de tout élément comme produit 
d’éléments premiers. 

Corps des fractions 
d'un anneau d'intégrité 

La construction du corps Q des nombres 
rationnels à partir de l’anneau Z des 
entiers relatifs se généralise sans difficulté 
à un anneau d’intégrité quelconque. Plus 
précisément, on a le résultat suivant : « Si 
A est un anneau d’intégrité, il existe un 
corps K contenant A comme sous-anneau 
et dont tous les éléments sont de la forme 
xy \ x, y éléments de A. De plus, un tel 
corps K est unique à un isomorphisme 
laissant A fixe près. » 

Pour faire comprendre la démonstra- 
tion, analysons ce qu’est un nombre ration- 
nel. Un nombre rationnel u est « défini » 
par une fraction pjq, où p et q sont des 
entiers relatifs, mais deux fractions pjq et 


p'/q\ distinctes, possédant des numéra- 
teurs et des dénominateurs distincts, peu- 
vent définir le même nombre rationnel si 
pq — pq . De plus, si pjq et pjq ' sont des 
fractions définissant des nombres ration- 
nels u et v, les fractions (pq'+p'q)/qq ' et 
pp'jqq définissent les nombres rationnels 
u-\rv et uv. La démonstration générale est 
calquée sur la construction ci-dessus ; 
donnons-en l’esquisse. 

Nous allons d’abord définir la notion de 
« fraction ». Pour cela, désignons par A* 
l’ensemble des éléments non nuis de A et 
considérons l’ensemble AXA* des cou- 
ples (a, y), y ^ 0 ; un tel élément (x, y) 
s’appelle une « fraction » de numérateur x 
et de dénominateur y. Nous allons main- 
tenant identifier des fractions (x, y) et 
(x\ y') telles que xÿ — x'y, c’est-à-dire 
considérer sur l’ensemble A X A* la 
relation d’équivalence ainsi définie. 
L’ensemble des classes d’équivalence 
forme un ensemble que nous désignerons 
par K. On vérifie alors facilement que, si 
on définit la somme et le produit de deux 
« fractions » par les formules : 

{x,y) + (x\y’) = (xy' +x'y,yy') 
(x,y)(x',y') = (xx\yy’\ 

on obtient sur K, par passage au quotient , 
deux opérations qui en font un corps ; cela 
signifie que, si u et u sont des éléments de 
K représentés par des « fractions » (x, y) 
et (x', y), alors par définition, u-\-iï et uu 
sont les éléments de K représentés 
par les «fractions» (x, y) -h (x', y') et 
(x, y) (x', ÿ) et que u -j- u' et uu ' ainsi 
définis dont indépendants du choix des 
« fractions » représentant u et v. 

Le plongement de A dans K s’effectue 
maintenant en identifiant tout élément de 
A à l’élément de K défini par la « fraction » 
(a, 1), dont le numérateur est égal à a et le 
dénominateur à 1 . Remarquons que, si on 
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identifie deux éléments a et b de A à leur 
image dans K, l’élément de K représenté 
par la « fraction » ( a , b) est bien le quotient 
(dans K) de a par b. 

Le corps K que nous venons de cons- 
truire s’appelle le corps des fractions de 
l’anneau A. 

Idéaux 

Rappelons qu’un idéal d’un anneau A est 
un sous-groupe additif qui est stable par 
multiplication par un élément quelconque 
de A, qu’il possède certaines propriétés. 
Nous nous contenterons de montrer com- 
ment on peut étendre aux idéaux le langage 
arithmétique usuel relatif aux nombres 
entiers. 

Les idéaux du type le plus simple sont 
obtenus ainsi : si a est un élément d’un 
anneau A, l’ensemble des multiples de a , 
c’est-à-dire l’ensemble des éléments de la 
forme xa pour x parcourant A, est un idéal 
de A, noté (a), et appelé l’idéal principal 
engendré par a. Un tel idéal est propre 
c’est-à-dire non réduit à 0 et différent de A 
tout entier si, et seulement si, a est non nul 
et non inversible. On verra, dans la deu- 
xième partie, que tout idéal de l’anneau Z 
des entiers relatifs est de ce type. Remar- 
quons au passage que, dans un anneau 
d’intégrité, deux éléments a zi b non nuis 
engendrent le même idéal principal si et 
seulement s’ils sont associés, c’est-à-dire si 
b — ua, u inversible dans l’anneau : en 
effet, si (a) — (/>), il existe des éléments u 
et v tels que b ~ ua, a = vb, d’où 
vua = a ; si a 0, on a donc vu — 1 
puisqu’il n’y a pas de diviseurs de zéro 
dans l’anneau et ainsi u est inversible. Plus 
généralement, si a A , ..., a n sont des élé- 
ments de A, l’ensemble, noté (a h ..., a n ) des 
éléments de la forme x ] a l + ... x n a n 
pour x t ..., x n parcourant A indépendam- 
ment l’un et l’autre est un idéal ; la 


quatrième partie est consacrée à l’étude 
des anneaux dans lesquels tout idéal est de 
ce type. 

Étant donné deux idéaux a et b, leur 
intersection a Pi b est encore un idéal. 
Généralisons aux idéaux la notion de 
produit : a et b étant deux idéaux, l’ensem- 
ble des sommes finies a x b x + ... + a n b tr 
où les üj et les b t sont des éléments de a et 
b respectivement, est encore un idéal, 
appelé produit des idéaux a et b et noté ab. 
Le produit ainsi défini est commutatif, 
associatif et admet un élément unité qui est 
l’anneau tout entier A — (1) (parfois 
appelé, pour cette raison, idéal unité). Si A 
est un anneau d’intégrité, le produit de 
deux idéaux non nuis (c’est-à-dire diffé- 
rents de {0}) est non nul et par suite 
l’ensemble M(A) des idéaux non nuis est 
un monoïde pour cette loi de composition ; 
le monoïde M(A) jouera un rôle très 
important dans la troisième partie. Remar- 
quons que si a = {a) et b — (b) sont 
principaux, alors on a ab — {ab) et par 
suite l’application a {a) est un homo- 
morphisme du monoïde A* dans le 
monoïde M(A) (l’image d’un produit est le 
produit des images, et l’élément unité a 
pour image l’élément unité). 

Deux éléments a et b de A sont dits 
congrus modulo un idéal a, et on note : 

a = b (mod. a) 

si la différence a — b appartient à a ; dans 
le cas où a = (c) est principal, on retrouve 
la notion usuelle de congruence modulo c. 
Considérons l’ensemble quotient, noté 
A/a, de A par cette relation (c’est mani- 
festement une relation d’équivalence). Si 
a et b sont les classes de a et b respecti- 
vement, on vérifie que a + b et 
ab sont indépendants des représentants 
a zi b choisis et que les deux lois de 
composition ainsi définies font de A/a 
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un anneau commutatif unitaire appelé 
anneau quotient de A par l’idéal a. Dans 
le cas où A est l’anneau Z des entiers 
relatifs et a l’ensemble (n) des multiples 
d’un entier n f cet anneau n’est autre que 
l’anneau des classes résiduelles d’entiers 
modulo n . 

Un idéal p ^ A est dit premier s’il ne 
contient le produit ab de deux éléments de 
A que lorsqu’il contient au moins l’un 
d’entre eux ; dans l’anneau Z des entiers, 
cette condition caractérise les idéaux prin- 
cipaux (p) engendrés par un nombre pre- 
mier p. On voit facilement qu’un idéal est 
premier si, et seulement si, l’anneau quo- 
tient est sans diviseurs de zéro ; ainsi, un 
exemple important d’idéaux premiers est 
constitué par les idéaux maximaux p 
(idéaux qui ne sont contenus dans aucun 
autre idéal propre) caractérisés par le fait 
que A/p est un corps. Généralisons main- 
tenant aux idéaux quelconques les proprié- 
tés des idéaux principaux de Z engendrés 
par les puissances des nombres premiers : 
un idéal q est dit primaire si ab E q et a 2 q 
entraînent qu’une puissance de b appar- 
tient à q, il résulte des définitions que si q 
est primaire, son radical , qui est l’ensemble 
des éléments dont une puissance appar- 
tient à q, est premier. Nous verrons, dans 
la quatrième partie, l’importance des 
idéaux primaires. 

Eléments entiers 

Soit A un anneau d’intégrité contenu 
dans un corps K. On dit qu’un élément de 
K est entier sur A s’il est racine d’un 
polynôme : 

x" + a x x n ~ l + ... + a n 

à coefficients dans A et dont le coefficient 
dominant est égal à 1 . Il est clair que tout 
élément de A est entier sur A puisqu’il est 
racine du polynôme x — a ; on peut mon- 


trer que l’ensemble des éléments de K qui 
sont entiers sur A forme un anneau (qui 
contient donc A) appelé la fermeture 
intégrale de A dans AT. Un cas particuliè- 
rement important est celui où K est le 
corps des fractions de A (cf. supra) ; si les 
seuls éléments du corps des fractions de A 
qui sont entiers sur A sont les éléments de 
A, on dit que l’anneau A est intégralement 
clos. Ces anneaux jouent un rôle essentiel 
dans de nombreuses questions, en théorie 
des nombres et en géométrie algébrique 
notamment. 

2. L'arithmétique élémentaire 

et les anneaux principaux 

Un anneau principal est un anneau d’inté- 
grité dans lequel tout idéal est principal, 
c’est-à-dire formé des multiples d’un même 
élément, appelé générateur de l’idéal. 
L’étude de la divisibilité dans un tel anneau 
est analogue à la théorie arithmétique 
élémentaire des nombres entiers, qui en 
constitue d’ailleurs un cas particulier. 
L’étude de la divisibilité dans l’anneau 
K[X] des polynômes à une variable sur un 
corps K rentre aussi dans ce cadre. 

Exemples 

a) Montrons que Vanneau Z des entiers 
relatifs est principal. La démonstration 
repose sur la propriété suivante de divisi- 
bilité dans cet anneau : étant donné deux 
entiers rationnels a et b, b > 0, il existe un 
couple et un seul d’entiers rationnels q et 
r tels que : 

a = bq + r, 0 < r < è ; 

les nombres q et r s’appellent respective- 
ment le quotient et le reste de la division 
de a par b. Soit donc maintenant a un idéal 
de Z. Si a — (0), on a a = (0) ; sinon a 
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contient des éléments strictement positifs 
puisque avec tout élément a il contient son 
opposé — a = ( — 1 ) a. Soit b le plus petit 
élément strictement positif de a ; montrons 
que tout élément a de a est un multiple de 
b . En effet, l’existence de la division dans Z 
permet d’écrire a == bq 4- r, 0 < r < b ; 
or le multiple bq de b appartient à a, donc 
aussi r = a — bq : la définition de b 
entraîne r = 0. 

b) Un autre exemple important 
d’anneau principal est l’anneau K[X] des 
polynômes à coefficients dans un corps 
commutatif K. La démonstration repose 
ici encore sur l’existence dans cet anneau 
d’une division « euclidienne » : si A et B 
sont des polynômes, il existe un couple et 
un seul de polynômes Q et R tels que 
A — BQ + R, le degré de R étant stric- 
tement inférieur au degré de B. On montre 
alors, par une démonstration analogue à ce 
qui précède, qu’un idéal a ^ ( 0 ) de K[X] 
est formé des multiples de tout polynôme 
B non nul de a dont le degré est le plus petit 
possible (cf. polynômes). 

c) À propos de recherches sur les 
formes quadratiques, Gauss a utilisé le fait 
que l’anneau des nombres complexes de la 
forme a + bi, a, bGZ (appelés entiers de 
Gauss), possède une arithmétique compa- 
rable à celle des entiers ordinaires. Ce fait 
s’explique, avec la terminologie ci-dessus, 
par le fait que cet anneau est principal. 

Plus grand commun diviseur 
et plus petit commun multiple 

Dans ce qui suit, nous nous limiterons, 
pour simplifier les notations, au cas de 
deux éléments, mais il est clair que tous les 
résultats s’étendent sans difficulté au cas 
d’un nombre fini d’éléments. 

Soient x, y deux éléments d’un anneau 
principal A et considérons l’idéal (x, y) 


constitué par les éléments de la forme 
ax + by, a , b E A. Puisque A est princi- 
pal, cet idéal est engendré par un élément 
d, déterminé à cela près qu’on peut le 
remplacer par ud , où u est un élément 
inversible quelconque de l’anneau. On 
appelle plus grand commun diviseur (en 
abrégé P.G.C.D.) de x et y tout élément d 
tel que (x, y) = (d). 

Puisque d G (, d ), on voit en particulier 
qu’il existe a, b E A tels que : 

(*) d ~ ax + by 

(ce résultat constitue le théorème de 
Bezout ). Justifions la terminologie adoptée 
en montrant qu’un élément z de A divise 
simultanément x et y si et seulement s’il 
divise d : puisque (d) contient x et y, ces 
nombres sont des multiples de d et, par 
suite, tout diviseur de d divise x et y ; 
réciproquement, si z divise x et y, écrivons 
x — zx\ v — zy\ et portons dans (*) ; on 
obtient d = z(ax' + by'), ce qui prouve 
que z divise d . Dans le cas de l’anneau Z 
des entiers rationnels, d est déterminé au 
signe près puisque les seuls éléments inver- 
sibles sont ici + 1 et — 1 ; on peut donc 
prendre d > 0 et on retrouve la notion 
élémentaire de P.G.C.D. enseignée dans 
les classes primaires. 

Deux éléments x et y de A sont dits 
premiers entre eux s’ils admettent 1 pour 
P.G.C.D., c’est-à-dire si leurs seuls divi- 
seurs communs sont les unités de l’anneau. 
D’après le théorème de Bezout indiqué 
ci-dessus, x et y sont premiers entre eux si 
et seulement s’il existe des éléments a , 
b G A tels que ax 4 -by = 1 (la condition 
suffisante résulte du fait que, si cette 
relation est satisfaite, tout diviseur com- 
mun à x et y divise 1 ). Ce résultat entraîne 
facilement le théorème de Gauss (ou lemme 
d’Euclide ), qui s’énonce : « Soit x et y des 
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éléments non nuis d’un anneau principal A 
et d un diviseur du produit xy ; si d et x sont 
premiers entre eux, alors d divise y. » En 
effet, puisque d et x sont premiers entre 
eux, il existe w, v GA tels que : 

ud + vx = 1 

d’où après multiplication par y , 
y — yud + vxy 

puisque d divise xy et yud , il divise aussi y. 

Soit encore x et y des éléments d’un 
anneau principal A. Les multiples de x 
et de y sont les éléments de (x) et (y) 
respectivement et par suite les multiples 
communs à x et y sont les éléments de 
l’idéal (x) H (y). Puisque l’anneau A est 
principal, cet idéal est formé des multi- 
ples d’un élément défini à un facteur 
inversible près : on appelle plus petit 
commun multiple (en abrégé P.P.C.M.) 
de x et y tout élément m de A tel 
que (x) f) (>’) = (m) ; avec cette défini- 
tion, tout multiple de x et y est un multiple 
de m. 

Décomposition en facteurs premiers 

Pour tout anneau d’intégrité, on a défini 
sous le titre 1 les éléments premiers. On 
peut montrer que les anneaux principaux 
possèdent les deux propriétés fondamen- 
tales (F,) et (F 2 ) suivantes. 

(F,) Décomposition en facteurs pre- 
miers . Tout élément x non nul et non 
inversible est produit d’un nombre fini 
d’éléments premiers (pas nécessairement 
distincts). 

(F 2 ) « Unicité » de la décomposition. Si 

X =P\P2-Pn =P\P2-Pm 

sont deux décompositions d’un élément x 
comme produit d’éléments premiers, alors 
m — «, et, quitte à modifier éventuelle- 
ment l’ordre des facteurs, les éléments p t et 


p'i sont associés (c’est-à-dire p t = up h w, 
inversible), pour i — 1,2 

Remarquons que, puisque deux élé- 
ments de A engendrent le même idéal 
si et seulement s’ils sont associés, les 
conditions (F,) et (F 2 ) expriment que tout 
idéal de A non nul et différent de A (de 
la forme (x) puisque A est principal) 
s’écrit, de manière unique à l’ordre près 
des facteurs, comme un produits d’idéaux 
premiers : 

(*) = (Pù<P2)-(p n ); 

ainsi la situation est plus simple dans le 
monoïde M(A) que dans le monoïde A* 
puisqu’il n’y a plus cette fois d’ambiguïté 
quant au sens à donner à l’expression 
unicité de la décomposition. Dans la prati- 
que, on élimine cette ambiguïté en choi- 
sissant une fois pour toutes un ensemble P 
d’éléments premiers de A tels que pour 
tout élément premier p de A il existe un 
élément premier p de P et un seul qui soit 
associé à p . Les propriétés (F^ et (F 2 ) 
s’expriment alors ainsi : tout élément x de 
A s’écrit, de manière unique à l’ordre près 
des facteurs, sous la forme : 

X = up x p 2 ...p n 

où u est une unité de A et où les />, sont des 
éléments de P (pas nécessairement dis- 
tincts). Ainsi, dans le cas de l’anneau Z des 
entiers relatifs, on peut prendre pour P 
l’ensemble des nombres premiers positifs, 
et tout entier relatif x s’écrit de manière 
unique sous la forme : 

x — zp x p 2 ... p n , z = + 1. 

Anneaux factoriels 

De manière générale, on appelle anneau 
factoriel tout anneau d’intégrité possédant 
les propriétés (Fj) et (F 2 ) ; remarquons 
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d’ailleurs que l’on peut remplacer la condi- 
tion (F 2 ) par la condition suivante : 

(F 3 ) Si un élément premier de A divise 
un produit, il divise au moins un des 
facteurs de ce produit. 

Les anneaux factoriels constituent une 
classe plus vaste que celle des anneaux 
principaux ; cette classe possède la remar- 
quable propriété de stabilité suivante : si A 
est un anneau factoriel, alors l’anneau A[X] 
des polynômes à coefficient dans A est lui 
aussi factoriel. On obtient ainsi, par récur- 
rence, que l’anneau K[X b ...,XJ des poly- 
nômes à n variables sur un corps K est 
factoriel, alors qu’il n’est pas principal pour 
n ^ 2 (en effet, dans l’anneau K[X,Y] des 
polynômes à deux variables, l’idéal (X,Y), 
formé des polynômes de la forme 
XP(X,Y) + YQ(X,Y), n’est pas principal). 
L’anneau K[[X]] des séries formelles à coef- 
ficients dans un corps K est factoriel ; mais, 
par contre, l’anneau A[[X]] peut ne pas être 
factoriel même si A est un anneau factoriel 
(contre-exemple dû à Samuel). 

Pour terminer, signalons, en liaison 
avec la définition donnée plus haut, que 
tout anneau factoriel est intégralement clos . 
En effet, soit xy~\ .y, y éléments de A, un 
élément du corps des fractions de A ; on 
peut supposer que .y et y n’ont pas de 
facteurs premiers communs. Si xy~ x est 
entier sur A, il est racine d’un polynôme à 
coefficients dans A dont le coefficient 
dominant est égal à 1, soit : 

x n y -n + QÇC n-ly-n + 1 + ... + a n = 0 , 

Oj E A ; on en déduit que : 

= — y(a,x n - ] + ... + a n y"~'), 

c’est-à-dire que .y" est un multiple de y. 
Mais si n’est pas un élément inversible de 
A, on obtient une contradiction puisque, 
d’après (F 3 ), tout diviseur premier de y 
doit alors diviser x . 


3. Les anneaux de Dedekind 
et la théorie multiplicative 
des idéaux 

L’extension de l’arithmétique classique 
aux anneaux d’entiers algébriques s’est 
longtemps heurtée au fait que ces anneaux 
ne sont pas factoriels. Par exemple, dans 
l’anneau Z[V— 3] des nombres complexes 
de la forme a + ib VJ, a, b entiers relatifs, 
le nombre 4 admet les deux décomposi- 
tions : 

4 = 2x2 — (1+ / V3)(l — i V3) 

en facteurs premiers non associés deux à 
deux et par suite cet anneau n’est pas fac- 
toriel. Dedekind, à partir des travaux de 
Kummer, mit en évidence que, pour un tel 
anneau A, la notion importante était celle 
d’idéal premier et non pas d’élément pre- 
mier, comme pouvait le faire croire l’étude 
élémentaire des entiers relatifs. En somme, 
tout revient ici à remplacer l’étude du 
monoïde A* des éléments non nuis de A par 
celle du monoïde M(A) des idéaux non nuis 
de A ; on trouve l’unicité de la décomposi- 
tion en facteurs premiers « idéaux ». Cha- 
que élément a non inversible de A* étant 
identifié à l’idéal principal (a) qu’il engen- 
dre peut ainsi s’écrire, de manière unique, 
comme un produit d’idéaux premiers. 

La définition abstraite des anneaux de 
Dedekind que nous formulons ici a été 
donnée pour la première fois, en 1927, par 
la mathématicienne allemande Emmy 
Noether. 

Anneaux de Dedekind 

Par définition, on appelle anneau de Dede- 
kind tout anneau intégralement clos et 
noethérien (c’est-à-dire dans lequel tout 
idéal est engendré par un nombre fini 
d’éléments, cf. infra) dans lequel tout idéal 
premier non nul est maximal. Cela signifie 
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que le quotient de A par un idéal premier 
non nul quelconque est non seulement un 
anneau d’intégrité mais même un corps. 

L’exemple le plus simple d’un tel anneau 
est l’anneau Z \^d] des nombres de la 
forme a + b Vcl^ a , b entiers relatifs, d 
entier tel que d = 2 ou 3 (mod. 4). Plus 
généralement, Dedekind a démontré que, 
si K est une extension finie du corps Q des 
nombres rationnels (K est appelé un corps 
de nombres algébriques), alors la fermeture 
intégrale A de l’anneau Z dans K est un 
anneau de Dedekind (A est appelé l’anneau 
des entiers du corps K ; cf. théorie des 
nombres - Nombres algébriques). En fait, 
l’exemple précédent, qui est très important 
en théorie des nombres, est lui-même un cas 
particulier du résultat algébrique suivant : 
soit A un anneau de Dedekind, de corps des 
quotients K, et soit L une extension finie de 
K (cf. corps) ; alors la fermeture intégrale 
de A dans L est un anneau de Dedekind. 

L’intérêt essentiel des anneaux de 
Dedekind réside dans la structure particu- 
lièrement simple, pour un tel anneau, du 
monoïde M(A) des idéaux non nuis. On a 
le résultat suivant : un anneau d’intégrité 
A est un anneau de Dedekind si, et 
seulement si, tout idéal non nul de A s’écrit 
de manière unique (à l’ordre près des 
facteurs) comme produit d’idéaux pre- 
miers non nuis. Soit a un tel idéal non nul ; 
écrivant p" si l’idéal premier p figure a fois 
dans la décomposition de a, on peut donc 
écrire a de manière unique sous la forme : 

■ = »î*»î* 

les p, étant des idéaux premiers distincts. 
Désignant par P l’ensemble des idéaux 
premiers non nuis de A, on écrit souvent 
cette décomposition sous la forme : 

(1) a = 

p€P 


en convenant que v p (a) = 0 quand l’idéal 
premier p ne figure pas dans la décompo- 
sition de a ; par définition le produit 
ci-dessus est alors égal au produit fini 
correspondant aux idéaux tels que 
v p (a) > 0. L’intérêt de cette convention 
réside dans des formules du type suivant : 
si a et b sont deux idéaux, alors on a : 

ab — 1 1 p v p( fl ) + V JP\ 
p<=p 

c’est-à-dire, avec les notations ci-dessus, 
Vp(ab) = v p (a) + v p (b). 

Remarquons que l’existence et l’unicité 
de la décomposition de tout idéal de M(A) 
comme produit d’idéaux premiers permet 
d’appliquer à M(A) tous les résultats 
élémentaires relatifs à la divisibilité des 
entiers ; par exemple si a et b sont deux 
idéaux non nuis, leurs diviseurs communs, 
ou leurs multiples communs, sont les 
diviseurs, ou les multiples, d’éléments 
appelés respectivement le P.G.C.D. et le 
P.P.C.M. de a et b et qui s’écrivent : 

J~J pinf(v p (a), v v (b)) JJ p sup(v p (a), 

pGP PGP 

respectivement. 

Idéaux fractionnaires 

Soit A un anneau d’intégrité ; la structure 
du monoïde M(A) des idéaux non nuis 
donne des indications sur la structure du 
monoïde multiplicatif A*. De la même 
manière, pour étudier la structure du 
groupe multiplicatif K* du corps des 
quotients K de A, on est amené à étendre 
la notion d’idéal. 

Un sous-ensemble a, non réduit à {0}, 
de K est appelé un idéal fractionnaire si 
c’est un sous-anneau de K stable par 
multiplication par les éléments de A et 
pour lequel il existe un élément d ^ 0 de 
A tel que dx appartienne à A pour tout .v 
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de a ; cette définition revient à dire qu’un 
idéal fractionnaire est l’ensemble des pro- 
duits d~ l y, d non nul fixé, lorsque y 
parcourt un idéal (au sens usuel) de A. Il 
est clair qu’un idéal non nul est un idéal 
fractionnaire ; dans la théorie des idéaux 
fractionnaires, on appelle souvent idéaux 
entiers les idéaux usuels pour éviter toute 
confusion. 

Il est facile de généraliser aux idéaux 
fractionnaires les opérations usuelles sur 
les idéaux : en particulier, si a et b sont des 
idéaux fractionnaires, on vérifie que 
l’ensemble des sommes finies d’éléments 
du type xy, x dans a et y dans b, est un 
nouvel idéal fractionnaire appelé le pro- 
duit de a et b noté ab ; l’ensemble I(A) des 
idéaux fractionnaires non nuis est ainsi un 
monoïde pour cette multiplication. Un 
idéal fractionnaire a est dit inversible s’il 
existe un idéal fractionnaire b tel que 
ab — A. Avec cette terminologie, on peut 
maintenant donner une nouvelle définition 
des anneaux de Dedekind : « Un anneau 
de Dedekind est un anneau d’intégrité tel 
que tout idéal fractionnaire non nul est 
inversible. » Le monoïde I(A) des idéaux 
fractionnaires non nuis est alors un groupe 
multiplicatif et tout élément de ce groupe 
peut s’écrire, de manière unique à l’ordre 
des facteurs près, sous la forme : 

(2) a — Y J pM a ) 

P6P 

où les v p (a) sont des entiers relatifs , nuis 
sauf pour un nombre fini d’idéaux pre- 
miers. Dans cette décomposition, les 
idéaux entiers sont caractérisés par le fait 
que v p (a) ^ 0 pour tout idéal premier non 
nul. 

Valuations et idéaux premiers 

Soit A un anneau de Dedekind. Pour tout 
élément a ^ 0 de A, l’idéal principal (a) a 


une décomposition du type (1) : posons, 
par définition, v p (a) = v p ((a)) et étendons 
cette fonction au corps K des fractions de 
A en posant : 

v P (xy^ 1 ) = v p (x) — v p (y), 

V p (0) = + oo. 

On vérifie que, pour z = xy 1 dans K, la 
valeur ainsi définie est indépendante de la 
décomposition xyr x choisie ; le nombre 
v p {z) ainsi défini n’est autre que l’exposant 
de p dans la décomposition (2) de l’idéal 
fractionnaire (z) (formé des éléments az 
pour a parcourant A). On obtient ainsi une 
valuation (discrète normée) sur K, c’est- 
à-dire une fonction v définie sur K et à 
valeurs dans Z U {+ oc) telle que : 

(a) pour z parcourant K*, v(z) parcourt 
l’ensemble Z des entiers relatifs et 
v(0) = + oo ; 

(b) v (z \Z 2) = v (z d v (z 2 ) ; 

(c) v(z l +z 2 ) > min(v(z 1 ),v(z 2 )). 

Ainsi, à tout idéal premier p non nul, on a 
fait correspondre une valuation, dite essen- 
tielle ; par définition, une telle valuation 
prend des valeurs positives ou nulle sur 
tout élément de A. Réciproquement, on 
peut montrer que toute valuation (au sens 
ci-dessus) positive sur A est obtenue à 
partir d’un idéal premier ; il existe ainsi 
une correspondance biunivoque entre les 
valuations (discrètes normées) positives 
sur A et les idéaux premiers non nuis de 
l’anneau A. Un exemple est donné par 
l’anneau Z des entiers relatifs et l’anneau 
Z p des nombres Radiques (cf. théorie des 
nombres - Nombres /?-adiques). 


4. Anneaux noethériens 

Avant Hilbert, les mathématiciens 
connaissaient fort peu de résultats sur les 
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anneaux de polynômes à plusieurs varia- 
bles. À propos de recherches sur la théorie 
des invariants, Hilbert mit en évidence le 
fait que tout idéal d’un tel anneau est 
engendré par un nombre fini d’éléments et 
montra tout le parti que l’on pouvait tirer 
de cette propriété ; par là même, il 
dégageait l’importance des anneaux avec 
conditions de finitude qui allaient être 
étudiés systématiquement sous forme 
générale par E. Noether. Signalons que les 
conditions de finitude en un sens plus large 
jouent un rôle absolument essentiel dans 
toutes les recherches « géométriques » 
contemporaines en géométrie algébrique 
ou analytique (au sens moderne, à savoir 
l’étude des espaces analytiques) et dans de 
nombreuses questions d’algèbre homolo- 
gique. 

Définitions équivalentes 

Un anneau noethérien est un anneau com- 
mutatif unitaire A qui vérifie une des trois 
conditions de finitude équivalentes suivan- 
tes : 

Condition ( a ), dite de chaîne ascen- 
dante : « Toute suite strictement croissante 
d’idéaux est finie », ou encore : « Si : 

a i C. a 2 C ... Ca^C ... 

est une suite infinie d’idéaux de A 
encastrés, il existe un entier n tel que 

— I ... ». 

Condition (b) : « Toute famille non vide 
d’idéaux a un élément maximal », ce qui 
signifie que si (a,), G h I non vide fini ou non, 
est une famille d’idéaux de A, il existe un 
indice i Q pour lequel l’idéal a ( - n’est 
contenu strictement dans aucun autre idéal 
de la famille. 

Condition (c) : « Tout idéal est engen- 
dré par un nombre fini d’éléments », 
c’est-à-dire que si a est un idéal de A, il 
existe des éléments x { , ..., x n , en nombre 


fini, tels que a soit l’ensemble des éléments 
de la forme a x x x + ... + a„x n lorsque a h 

a n parcourent A indépendamment l’un 
de l’autre. 

Esquissons la démonstration de l’équi- 
valence de ces trois conditions car elle est 
instructive. Pour montrer que ( a ) entraîne 
(b), on raisonne par l’absurde. Si la famille 
(a,) /ei n’admettait pas d’élément maximal, 
alors pour tout /El on pourrait trouver 
y E I tel que l’idéal a,- contienne strictement 
l’idéal a, et on pourrait construire ainsi, par 
récurrence à partir d’un idéal a,-, une suite 
infinie strictement croissante d’idéaux. 

Montrons que (b) entraîne (c). Soit a un 
idéal et considérons la famille des idéaux 
de type fini (c’est-à-dire engendré par un 
nombre fini d’éléments) contenus dans a ; 
cette famille est non vide car elle contient 
{0} et par suite elle admet un élément 
maximal b engendré par des éléments 
X \, ..., x n . Pour tout x de b, l’idéal engendré 
par les éléments ..., x contient b, 
appartient à la famille d’idéaux considérée 
et par suite est égal à b puisque b est 
maximal. Ainsi a = (x b ..., x n ). 

Pour terminer, montrons que (c) 
entraîne (a). Soit a„ une suite croissante 
d’idéaux encastrés. On vérifie que, dans ce 
cas, la réunion des idéaux a w est encore un 
idéal ; d’après (c), cet idéal est engendré 
par un nombre fini d’éléments a',, ..., x„ 
et, par définition d’une réunion, il 
existe des entiers p h ..., p n tels que 

Xj E x n E u P i . Il est maintenant clair 

que, si p est le plus grand des entiers p { , .... 
p n , on a a*. — a pour k > p. 

Exemples d'anneaux noethériens 

Par définition, les anneaux de Dedekind, et 
en particulier, bien entendu, les anneaux 
principaux, sont des anneaux noethériens. 
Une source importante d’exemples ne 
rentrant pas dans les précédents est la 
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remarquable propriété de stabilité sui- 
vante, découverte par Hilbert : si A est un 
anneau noethérien, l’anneau A[X] des 
polynômes à coefficients dans A est lui 
aussi noethérien ; par récurrence, ce résul- 
tat s’étend à l’anneau A[X b XJ des 
polynômes à n variables sur un anneau 
noethérien A. On obtient ainsi que 
l’anneau des polynômes à n variables à 
coefficients dans un corps K est noethé- 
rien, alors que cet anneau n’est ni princi- 
pal, ni même de Dedekind, pour n ^ 2. 
Signalons que le théorème de Hilbert 
s’étend à l’anneau A[X,, ..., XJ des séries 
formelles à coefficients dans un anneau 
noethérien A ; dans le même ordre d’idées, 
si K est le corps des nombres réels ou 
des nombres complexes, l’anneau 
K {X b X,,} des séries convergentes est 
noethérien (cf. anneaux et algèbres). 

Décomposition primaire 

Remarquons que, pour un anneau com- 
mutatif avec unité, les opérations d’inter- 
section et de produit de deux idéaux jouent 
des rôles assez semblables. Dans le cas des 
anneaux principaux par exemple, si p et q 
sont deux éléments premiers, alors 
(p) (q) = (p) n (q) et par suite la décom- 
position d’un idéal en idéaux premiers peut 
s’écrire indifféremment : 

(*) = iP\)(Pi)- (p„) 

= <Pi)n<p 2 )n...n(p n ) ; 

cette situation est d’ailleurs la même pour 
un anneau de Dedekind quelconque. Dans 
le cas d’un anneau noethérien, le monoïde 
multiplicatif M(A) n’est guère utilisable, 
mais on peut donner un théorème de 
décomposition de tout idéal comme inter- 
section d’idéaux d’un type plus général que 
les idéaux premiers, les idéaux primaires 
(cf. supra). 


Le théorème de décomposition de 
Lasker-Noether affirme que tout idéal d’un 
anneau noethérien s’écrit sous la forme : 

a = jjj n q 2 n ... n q,, , 

où les q, sont des idéaux primaires auxquels 
on peut imposer les deux conditions sui- 
vantes ; aucun des idéaux q, ne contient 
l’intersection des autres et les radicaux p, 
des idéaux q, sont des idéaux premiers 
distincts (cf. supra , chap. 1). Il n’y a pas 
unicité pour une telle décomposition, mais 
les idéaux premiers p, définis ci-dessus sont 
déterminés de manière unique et appelés 
les idéaux premiers de l'idéal a. Parmi ces 
idéaux premiers, ceux qui sont minimaux, 
c’est-à-dire qui ne contiennent aucun des 
autres sont dits isolés et ont une grande 
importance en géométrie algébrique. Cette 
terminologie est justifiée par le fait que, 
dans le cas où a est un idéal de l’anneau 
K[X b ..., XJ des polynômes à n variables 
sur un corps K, ces idéaux isolés corres- 
pondent aux composantes irréductibles de 
l’ensemble des points K" où s’annulent 
simultanément tous les polynômes de 
l’idéal. 

JEAN-LUC VERLEY 
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ANNEAUX & ALGÈBRES 


D éfinis par des axiomes qui déga- 
gent les propriétés usuelles des 
opérations d’addition et de multiplica- 
tion dans les ensembles de nombres ou 
les polynômes, les anneaux constituent 
le cadre général dans lequel on peut 
appliquer les règles du calcul algébrique 
élémentaire. Nous donnerons dans cet 
article les définitions générales et des 
exemples. Pour une étude plus détaillée des 
anneaux qui interviennent en théorie des 
nombres ou en géométrie algébrique, nous 
renvoyons à l’intérieur de ce texte à 
d’autres articles. 




1. Définitions 
Anneaux 

Un anneau A est un ensemble muni 
de deux lois de composition internes 
(a% y) *—> - x + y et (.y, v) ► xy, appelées 
addition et multiplication respective- 
ment, qui possèdent les propriétés suivan- 
tes : 

(a) * + 0 >+z) = (*+jO + z 
(associativité de l’addition) ; 

(b) x y y =y y x 
(commutativité de l’addition) ; 

(c) existence d’un élément, noté 0, tel que, 
pour tout élément .y de A on ait : 

* + 0 = * 

(élément neutre pour l’addition) ; 


(d) existence, pour tout x de A, d’un 
élément, noté — .y, tel que : 

x y (—x) = o 

( — * est appelé l’opposé de x) ; 

(e) x(yz) = (xy)z 
(associativité de la multiplication) ; 

(f) x (y y z) = xy y xz 
{y y z)x =yx y zx 

(double distributivité de la multiplication 
par rapport à l’addition) ; 

(g) bien que cela ne soit pas toujours ainsi 
dans la littérature, nous supposerons l’exis- 
tence d’un élément unité pour la multipli- 
cation, souvent noté 1, tel que : 

1 x = x 1 = X. 

Les propriétés (a) à (d) expriment que 
A est un groupe commutatif pour l’addi- 
tion. 

Dans de nombreux exemples, la mul- 
tiplication est de plus commutative, c’est- 
à-dire xy = va* ; un tel anneau est alors dit 
commutatif. Cependant on ne peut pas se 
limiter à ce cas, car des anneaux impor- 
tants dans la pratique, les anneaux de 
matrices par exemple, ne possèdent pas 
cette propriété ; comme on le verra au 
début du chapitre, le calcul algébrique 
dans de tels anneaux réclame quelques 
précautions. Pour terminer, indiquons 
qu’un cas particulier très important est 
constitué par les anneaux dans lesquels 
tout élément non nul est inversible, c'est- 
à-dire a un inverse pour la multiplication ; 
un tel anneau s'appelle un corps (cf. 
corps). 

Un sous-ensemble B non vide d’un 
anneau A est appelé un sous-anneau , s’il 
contient l’unité multiplicative et x — y et 
at pour tout couple d’éléments .y et y de 
B ; B est alors un anneau pour les 
restrictions à B de l’addition et de la 
multiplication. 
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Algèbres 

Nous introduirons maintenant ici une 
autre structure qui se rencontre dans de 
nombreuses questions. 

Soit K un corps commutatif. On dira 
qu’un ensemble E est une K -algèbre, ou 
une algèbre sur K, si c’est un espace 
vectoriel sur le corps K muni d’une appli- 
cation, noté ici multiplicativement : 

E x E — - E 

qui est bilinéaire , c’est-à-dire linéaire par 
rapport à chaque facteur pris séparément : 

(a) Qjc + MT) *2 = X(x .y) + a(v -z), 

(b) x . (Xy + |jz) = X(x .y) + \\{x .z), 

quels que soient les éléments x, y, z de E 
et les « scalaires » À et p appartenant à K. 
On peut aussi définir une telle structure 
lorsque K n’est plus un corps, mais seu- 
lement un anneau commutatif. 

Si la multiplication est associative, on 
parle d 'algèbre associative ; cependant cer- 
tains auteurs oublient de le préciser et 
incluent l’associativité dans la définition 
d’une algèbre, mais précisent quand il n’y 
a pas associativité. 

Homomorphismes d'anneaux et algèbres 

Soient A et B deux anneaux (ou deux 
algèbres) et / une application de A dans B. 
Conformément aux définitions générales 
des morphismes, on dira que / est un 
homomorphisme d’anneau (ou d’algèbre) si 
/respecte la structure d’anneau (ou d’algè- 
bre) : 

/C*+t)=/<*)+/00, 

f{xy)=f{x)f{y) 

(et éventuellement, si A et B sont des 
algèbres, /(Àx) — À/ (x) pour tout scalaire 
À) pour des éléments x et y quelconques de 
A ; on impose de plus que l’image par / de 
l’élément unité de A soit l’élément unité de 


B. Un cas particulier très important est 
obtenu lorsque /est une application bijec- 
tive ; l’application inverse est alors aussi un 
homomorphisme ; on dit que f est un 
isomorphisme et que A et B sont des 
anneaux ou des algèbres isomorphes. Du 
point de vue de la théorie des anneaux, il 
n’y a pas lieu de distinguer entre eux des 
anneaux isomorphes. 

2. Exemples d'anneaux et algèbres 

On rencontrera des anneaux et des algè- 
bres dans de nombreux articles du présent 
ouvrage ; nous nous contenterons donc ici 
de choisir quelques exemples, de manière 
un peu artificielle, dans des domaines 
variés des mathématiques pour montrer la 
richesse de ces structures. 

Les ensembles de nombres sont des 
exemples très simples d’anneaux pour les 
opérations usuelles d’addition et de mul- 
tiplication : l’ensemble Z des entiers rela- 
tifs est un anneau commutatif unitaire et 
les ensembles Q, R, C, des nombres 
rationnels, réels et complexes respective- 
ment, sont des corps. Si A est un anneau 
commutatif, l’ensemble A [Xj, ..., XJ des 
polynômes à n variables à coefficients dans 
A est un anneau commutatif ; si A — K est 
un corps, alors l’anneau des polynômes à 
coefficient dans K est une algèbre sur K. 

Un exemple fondamental d’algèbre non 
commutative est constitué par l’algèbre 
y (E) des endomorphismes d’un espace 
vectoriel E ; si E est de dimension finie w, 
alors cette algèbre est isomorphe à l’algè- 
bre des matrices carrées d’ordre n, h n 
lignes et n colonnes (cf. algèbre linéaire et 
multilinéaire). 

Comme exemple d’algèbre non associa- 
tive, citons les algèbres de Lie (cf. 
groupes - Groupes de Lie). 
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Anneaux de Boole 

L’exemple suivant montre le caractère un 
peu insolite que peuvent présenter certains 
anneaux. L’ensemble .'/( E ) des parties 
d’un ensemble donné E est un anneau pour 
les opérations d’« addition » et de « mul- 
tiplication » qui à deux sous-ensembles X 
et Y de E font correspondre les sous- 
ensembles : 

(X n Y') u (X' n Y) et x n y 

respectivement, en désignant par X' et 
Y' les complémentaires de X et Y dans 
E ; l’élément nul est ici l’ensemble vide 
et l’élément unité est l’ensemble E tout 
entier. Remarquons que le « produit » de 
X par lui-même est égal à X car on a 

xnx = x. 

Revenons aux notations usuelles en 
désignant les éléments d’un anneau par des 
lettres minuscules. Généralisant la situa- 
tion précédente, on considère des anneaux, 
appelés anneaux de Boole , qui possèdent la 
propriété que le carré de tout élément est 
égal à cet élément : x 2 = xx = x. Il en 
résulte que, pour tout élément x, on a 
x -b x = 0 ; en effet, écrivant que le pro- 
duit de x 4- x par lui-même est égal à 
x + x, on obtient : 

X + x = (x + x) (x + x) 

= XX + XX + XX + XX = X -|- X + X + X, 

d’où la conclusion. Ces anneaux sont 
importants en logique symbolique (algèbre 
des propositions) et dans la théorie des 
circuits électroniques (algèbre des cir- 
cuits). 

Anneaux et aigèbres de fonctions 

Les fonctions réelles d’une variable réelle 
définies dans un intervalle [a, b] de la 
droite réelle constituent une algèbre en 
convenant que la somme et le produit de 
deux fonctions ou le produit d’une fonc- 


tion par un nombre réel À sont les fonc- 
tions dont les valeurs en chaque point sont 
respectivement la somme et le produit des 
valeurs en ce point ou le produit par X de 
la valeur de la fonction en ce point. Si on 
analyse les propriétés qui ont permis de 
munir l’ensemble précédent d’une struc- 
ture d’algèbre, on constate que, de manière 
générale, on peut munir d’une structure 
d’anneau ou d’algèbre l’ensemble des 
applications d’un ensemble quelconque E 
dans un anneau ou une algèbre respecti- 
vement, les valeurs en un point x de E des 
fonctions somme, produit et éventuelle- 
ment produit par un scalaire étant données 
par : 

V+ g) (*) = /(*) + g (*). <fg) (x) = f{x) g (X), 

(X ./)(*) = À. /(*). 

Le procédé précédent permet, bien 
entendu, de définir des structures 
d’anneaux ou d’algèbres sur de nombreux 
ensembles de fonctions contenus dans 
l’ensemble, considéré ci-dessus, de toutes 
les fonctions définies dans un ensemble et 
à valeurs dans un anneau ou une algèbre. 
Ainsi, les fonctions continues ou différen- 
tiables à valeurs réelles définies dans un 
ouvert du plan constituent des aigèbres sur 
le corps des nombres réels. Il est clair qu’il 
est possible de multiplier à volonté les 
exemples de ce type. 

Lorsqu’on s’intéresse à l’étude locale 
des fonctions au voisinage d’un point, on 
est conduit à introduire des anneaux et 
aigèbres d’un type différent du précédent. 
Nous prendrons pour exemple l’algèbre des 
germes de fonctions analytiques à l’origine O 
du plan complexe. Considérons les couples 
(U,/) d'un voisinage ouvert de O dans le 
plan complexe et d'une fonction/ définie et 
analytique dans U. Nous dirons que deux 
tels couples (U,/) et (V, g) définissent le 
même germe à l’origine si/et g coïncident 
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sur un voisinage ouvert W de O contenu 
dans U H V ; il est clair que cette relation 
est une relation d’équivalence ; par défini- 
tion, le germe d’une fonction analytique 
définie dans un voisinage de O est sa classe 
d’équivalence pour cette relation. Mon- 
trons que cet ensemble des germes peut être 
muni d’une structure d’algèbre sur le corps 
des nombres réels ou des nombres comple- 
xes. Soient A et B deux germes et À un 
nombre réel ou complexe. Si (U,/) et (V,g) 
définissent les germes A et B respective- 
ment, nous appellerons germe somme, 
germe produit et germe produit par le sca- 
laire À, noté A + B, AB et AA respective- 
ment, les germes à l’origine des couples 
(un v,/i + gj), (U nv,/ lgl ), et 
(U Pi V, A/j), où/| et désignent les res- 
trictions au voisinage U fl V des fonctions 
/ et g ; on vérifie alors facilement que les 
germes A + B, AB et AA sont indépen- 
dants des représentants (U,/) et (V, g) 
choisis et que l’ensemble des germes est 
ainsi muni d’une structure d’algèbre. De 
manière générale, les anneaux de germes de 
fonctions différentiables ou analytiques 
jouent un rôle absolument essentiel dans la 
théorie des variétés différentiables ou ana- 
lytiques. 

Anneaux de séries 

A étant un anneau commutatif, on 
peut définir de manière purement formelle 
et algébrique des séries à coefficients dans 
A ; dans le cas où A est le corps des 
nombres complexes ou des nombres réels, 
nous ferons jouer un rôle particulier à 
celles de ces séries, dites convergentes, qui 
possèdent un rayon de convergence non 
nul. 

On appelle série formelle (à une varia- 
ble) à coefficients dans un anneau com- 
mutatif A une suite infinie d’éléments de 


A : (< 2 0 , a u ..., ; une telle série for- 

melle est souvent notée : 

P > 0 

notation qu’il faut considérer pour l’ins- 
tant comme un pur symbole. Définissons la 
somme et le produit de deux telles séries 
formelles ; on pose, par définition, 

a„ + b p )XP , 

P > 0 pèO pè 0 

(Z^HZ^^Z^ 

p ^ 0 p ^ 0 p ^ 0 

où c p est la somme finie : 
a obp + a \ b p —\ + + ci k b p _ k + ... + a p b 0 . 

Il est facile maintenant de vérifier, en 
utilisant les règles du calcul algébrique 
dans les anneaux (cf. chap. 3), que l’ensem- 
ble A [[X]] de ces séries formelles est muni 
d’une structure d’anneau ; si A = K est un 
corps, cet anneau est une algèbre quand on 
définit la multiplication scalaire par la 
formule : 

A (^<7,») = ^(Aa,)»’. 

Par récurrence, on peut définir l’anneau 
des séries formelles à n variables à coeffi- 
cients dans A ; par définition, cet anneau, 
noté A [[Xj, ..., XJ], est égal à l’anneau des 
séries formelles (à une variable) à coeffi- 
cients dans l’anneau A [[X,, ..., X„_j]] des 
séries formelles à (n — 1) variables. Toute 
série formelle à n variables est définie par 
la donnée, pour tout système de n entiers 
7 positifs ou nuis, d’un élément 
a p " P , de l’anneau A et s’écrit symboli- 
quement sous la forme : 

w ZZ Z 

P > 0 P > 0 
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Limitons-nous maintenant au cas où A 
est le corps des nombres réels ou des 
nombres complexes. La série (*) est dite 
convergente si elle a un rayon de conver- 
gence non nul, c’est-à-dire s’il existe un 
nombre réel strictement positif R tel que la 
famille de nombres positifs : 

K + 

soit sommable (cela signifie qu’il existe un 
nombre M qui majore toute somme finie de 
tels nombres). On montre que si deux séries 
sont convergentes, alors les séries formelles 
somme et produit sont aussi des séries 
convergentes ; ainsi les séries convergentes 
à coefficients dans le corps des réels ou des 
nombres complexes forment des anneaux, 
qui sont d’ailleurs aussi des algèbres sur R 
ou C, notés R {Xj, X /7 } et 
C {Xj, X„} respectivement. L’étude de 
ces anneaux constitue la partie locale de la 
théorie des fonctions analytiques de plu- 
sieurs variables ; ainsi, montrons, pour 
n — 1 par exemple, que l’anneau C {X} 
des séries convergentes à coefficients com- 
plexes est isomorphe à l’anneau des germes 
de fonctions analytiques à l’origine intro- 
duit ci-dessus. En effet, toute fonction ana- 
lytique dans un voisinage de l’origine est 
développable en série entière convergente 
et deux telles fonctions définissent le même 
germe si, et seulement si, elles sont somme 
d’une même série entière dans un voisinage 
de l’origine ; par ailleurs, la valeur, pour 2 
complexe assez voisin de 0, de la somme des 
séries « somme » et « produit » est égale 
respectivement à la somme et au produit 
des sommes des séries considérées (cf. 
FONCTIONS ANALYTIQUES). 

Algèbres de dimension finie 

Soit A une algèbre sur un corps K dont 
l’espace vectoriel sous-jacent soit de 
dimension finie n et choisissons une base 


e h ..., e n de cet espace. On appelle table de 
multiplication de A la donnée des produits : 

n 

e i e j = ^ ^ a ijk e k 
k = 1 

(les h 3 éléments a jjk de K ainsi définis sont 
appelés les constantes de structure de l’algè- 
bre A) ; connaissant la table, on peut calcu- 
ler le produit de deux éléments quelconques 
par bilinéarité. On représente souvent la 
table par un schéma à double entrée. Par 
exemple, la table de multiplication du corps 
des nombres complexes considéré comme 
une algèbre de dimension 2 sur le corps des 
nombres réels est la suivante : 



1 i 

1 

1 i 

i 

i -1 


Réciproquement, soit E un espace vec- 
toriel muni d’une base e u ..., e fr Si on se 
donne, pour tout couple i, j d’entiers 
compris entre 1 et /?, des éléments de 
l’espace E, notés e n e p on peut prolonger 
cette loi par bilinéarité à l’espace E tout 
entier. L’espace E est alors une algèbre 
associative admettant cette loi pour mul- 
tiplication si, et seulement si, on a 
{e i ej) e k — e, (e f e k ) ; remarquons que 
l’algèbre ainsi construite est commutative 
si, et seulement si, <?, e y = e } e k Ce qui 
précède montre l’utilité des tables pour 
définir des algèbres. Nous allons donner 
un exemple célèbre de cette situation. 

Soit K un corps commutatif ; désignons 
par e , i, j , k la base canonique de l’espace 
vectoriel K 4 et choisissons deux élé- 
ments p et q de K. On appelle algèbre de 
quaternions sur K l’algèbre obtenue en 
considérant sur K 4 la table de multiplica- 
tion notée H : 

e 2 = e, ei = ie — i, ej — je — j, ek = ke = k, 
p = pe, p = qe, k 2 = — pqe, 

ij - ~ji ~ k J k = — kj = — qi , 

ki = —ik = — pj- 
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Un cas particulier très important 
s'obtient en prenant pour K le corps 
des nombres réels et en choisissant 
p z= q = — 1 ; on obtient ainsi les qualer- 
nions proprement dits, introduits par 
Hamilton. Pour ces quaternions, on peut 
développer une théorie analogue à 
celle des nombres complexes : si 
x — ae -b bi -+- cj + dk est un tel quater- 
nion, on appelle conjugué de x le quater- 
nion x — ae — bi — cj — dk ; les règles de 
calcul montrent alors que : 

xx = a 2 + b 2 -j- c 2 + d 2 , 

et par suite tout quaternion non nul x a un 
inverse : 

x~ l = ( a 2 4- b 2 + c 2 + d 2 )~ l x, 

tel que x.v" 1 = x~ ] x — e. On traduit cette 
propriété en disant que les quaternions 
forment un corps non commutatif ; cet 
exemple des quaternions constitue une 
situation très privilégiée, car on peut mon- 
trer que c’est le seul corps non commutatif 
de dimension finie sur le corps des nom- 
bres réels. 

Pour terminer, remarquons que les 
matrices de la forme : 

/ a + ib c + id\ 

V — c+iûf a — ib) 

où a, b, c, d sont des nombres réels 
quelconques forment une algèbre et que 
l’application qui, au quaternion ae + bi 
+ cj -j- dk , fait correspondre la matrice 
ci-dessus est un isomorphisme car les 
opérations usuelles sur les matrices cor- 
respondent ici aux opérations correspon- 
dantes sur les quaternions ; ainsi l’algèbre 
des quaternions est isomorphe à une algè- 
bre de matrices. La recherche d’algèbres 
de matrices isomorphes à une algèbre 
donnée est le problème fondamental de la 
représentation linéaire des algèbres ; la 


situation précédente constitue historique- 
ment le premier exemple d'une telle repré- 
sentation. 

3. Propriétés 

des anneaux et algèbres 

Calcul algébrique dans les anneaux 

Les règles du calcul algébrique usuel 
s’appliquent dans les anneaux moyen- 
nant quelques précautions dans le cas 
non commutatif ; par exemple, si 
x b ..., x m , y \ , ..., y n sont des éléments d’un 
anneau A, le produit 

(x\ H- - + -O Oq + ... + y n ) 
est égal à la somme des mn produits xjy 
Mentionnons une importante notation qui 
montre qu’on peut faire « opérer » 
l’anneau Z des entiers relatifs sur un 
anneau A quelconque. Si n est un entier 
relatif et x un élément de A, on désigne par 
nx la somme d’une suite de n termes égaux 
à x si n > 0, l’élément 0 si n = 0 et 
l’opposé de la somme de n — — n termes 
égaux à — x si n < 0 ; il est clair que cette 
notation possède les propriétés habituel- 
les : 

n (mx) = (nm)x, (n + m)x = nx + mx, 
n (x + y) = nx + ny, {nx) {my) — {nm) (xy), 

pour m, n dans Z et x, y dans A. 

L’exemple des anneaux de Boole mon- 
tre qu’il peut exister dans certains anneaux 
des entiers n > 0 tels que n 1 = 0 ; on 
appelle caractéristique d'un tel anneau le 
plus petit entier n > 0 pour lequel «1=0 
et on dit qu’un anneau est de caractéris- 
tique nulle si «1^0 pour tout n > 0. 
Ainsi tout anneau de Boole est de carac- 
téristique 2, alors que l’anneau des entiers 
relatifs est de caractéristique nulle ; de 
manière générale, tout anneau de caracté- 
ristique nulle contient une infinité d'élé- 
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ments (si « et m sont deux entiers relatifs 
distincts les éléments n\ et ml sont dis- 
tincts car (n — m) 1 ^ 0) et par suite tout 
anneau ne contenant qu’un nombre fini 
d’éléments est de caractéristique non nulle. 
Pour terminer avec les notations, indi- 
quons qu’on désigne par x" , n entier > 0, 
le produit d’une suite de n termes égaux à 
v ; il est clair que deux telles puissances de 
x vérifient : 

x n x m = x m x n = x n + m . 

Remarquons que, si x et y sont deux 
éléments quelconques d’un anneau A, on 
a : 

(x + y) (x—y) = x z — y 2 + xy —yx ; 

si x et y commutent : xy — yx, alors on 
retrouve la formule classique : 

(x +y)( X —y)=x 2 —y 2 . 

Cette situation se généralise aux identités 
remarquables , qui sont valables si les élé- 
ments qui y figurent commutent. Par 
exemple, on a : 

X" — y* = (x — y) (x"" 1 4- x n ~ 2 y 4- ... 

-f -xy*- % +y*-')> 
(x +j0» = *" + C\x n — l y 4- - 

_j_ ç p x n-p y p + ... + y n 

(formule du binôme) si x et y commutent. 

Puisque pour n premier tous les coef- 
ficients Cj, C 2 , Cr 1 sont des entiers 
divisibles par n , il résulte de la formule du 
binôme que si x et y sont deux éléments qui 
commutent dans un anneau de caractéris- 
tique n premier, on a (x + y) n — x" + y n ; 
d’autre part, sous les mêmes hypothèses, 
on a (xÿy* = x ,l ÿ\ Ainsi dans un anneau 
commutatif de caractéristique n premier 
l’application x ► x" est un homomor- 
phisme d’anneau. 

Dans un anneau quelconque, il n’est pas 
toujours possible de « simplifier par a » 


une égalité du type ax — ay. Ainsi, dans 
un anneau de Boole unitaire, on a toujours 
x 2 — x == x (x — 1) — 0 et, par suite, le 
produit de deux éléments non nuis peut 
être nul ; de même, dans l’anneau (de 
caractéristique nulle) des fonctions à 
valeurs réelles définies sur l’ensemble réu- 
nion de deux ensembles X et Y sans point 
commun, le produit de deux fonctions 
l’une nulle sur X et non nulle sur Y et 
l’autre nulle sur Y et non nulle sur X est 
nul (cf. chap. 2). De manière générale, on 
dit qu’un élément x ^ 0 d’un anneau A est 
un diviseur de zéro (à gauche) s’il existe un 
élément y ^ 0 tel que xy = 0. Un cas 
particulier de cette situation est constitué 
par les éléments non nuis dont une puis- 
sance est nulle (ainsi, dans l’anneau des 
entiers modulo 4, cf. infra , le carré de la 
classe du nombre 2 est la classe nulle) ; un 
tel élément non nul dont une puissance est 
nulle est appelé un élément nilpotent. Les 
anneaux commutatifs sans diviseurs de 
zéro sont dits intègres (on dit aussi qu’un 
tel anneau est un anneau d’intégrité ) ; on 
peut alors « simplifier » par un élément a 
non nul puisque ax = ay est équivalent à 
a (x — y) — 0 , qui entraîne x — y = 0 . 

Idéaux 

Soient A et B deux anneaux (ou deux 
algèbres) et / un homomorphisme 
d’anneau (ou d’algèbre) de A dans B. 
L’ensemble N des éléments de A dont 
l’image par / est l’élément nul de B est 
appelé le noyau de / ; c’est un sous-groupe 
additif (ou une sous-algèbre) de A qui 
possède la propriété supplémentaire sui- 
vante : « Pour tout élément x de A et tout 
élément y de N, les éléments xy et yx 
appartiennent encore à N. » De manière 
plus générale, on appelle idéal à gauche 
d’un anneau (ou d’une algèbre) A tout 
sous-groupe additif (ou sous-algèbre) tel 
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que si a* et y sont des éléments quelconques 
de A et U respectivement, xy soit un 
élément de Tl. On définirait de même les 
idéaux à droite caractérisés par le fait que 
yx appartient à Tl pour y dans Tl et x dans 
A. Un ensemble qui, comme le noyau d’un 
homomorphisme, est à la fois un idéal à 
droite et un idéal à gauche est appelé un 
idéal bilatère ; bien entendu, si l’anneau A 
est commutatif, tous ces types d’idéaux 
coïncident. Tout anneau contient au moins 
deux idéaux bilatères particulièrement 
simples, Yidéal nul contenant seulement 
l’élément 0 et Yidéal unité constitué par 
l’anneau tout entier ; un idéal distinct de 
ces deux idéaux est dit propre. On vérifie 
facilement que si un anneau est un corps, 
il n’a pas d’idéaux propres. Donnons deux 
exemples simples d’idéaux propres : dans 
l’anneau des entiers relatifs, les multiples 
d’un nombre n forment un idéal, noté (n) 
et appelé l’idéal principal engendré par n 
(cet idéal n'est pas nul si n ^ 0 et est 
différent de Z si n ^ ± 1 ) et on peut 
montrer que tout idéal est de ce type (cf. 
anneaux commutatifs) ; de même, dans 
un anneau de fonctions, l’ensemble des 
fonctions qui s’annulent en un point est un 
idéal. 

Indiquons maintenant un procédé sou- 
vent utilisé pour construire des idéaux ; 
idéal signifiera ici indifféremment idéal 
à gauche, à droite ou bilatère, sauf préci- 
sion complémentaire. On voit facilement 
que l’intersection d’une famille quelcon- 
que d’idéaux, finie ou non, est encore un 
idéal. On en déduit que si M est une partie 
quelconque de A, l’intersection des idéaux 
de A qui contiennent M (il existe au moins 
un tel idéal, à savoir A tout entier) est un 
idéal "IL, qui est le plus petit idéal conte- 
nant M ; on dit alors que M est un système 
de générateurs de Tl, ou encore que Tl est 
engendré par M. Par exemple, l’idéal à 


gauche engendré par l’ensemble contenant 
un seul élément a est l’ensemble des 
éléments de la forme xa lorsque x parcourt 
A, c’est-à-dire l’ensemble des « multiples à 
gauche » de a ; de manière générale, Y idéal 
à gauche engendré par une partie M de A, 
finie ou non, est identique à l’ensemble des 
sommes finies x { a x + ... + x n a n où (a,) est 
une famille finie quelconque d’éléments de 
M et les Xj des éléments quelconques de A. 

Un idéal Tl ^ A d’un anneau A est dit 
maximal s’il n’est contenu dans aucun 
autre idéal propre de A. Déterminons à 
titre d’exemple les idéaux maximaux de 
l’anneau Z des entiers relatifs. Admettons 

ici (cf. ANNEAUX COMMUTATIFS) que tOUt 
idéal de Z est égal à l’ensemble (n) des 
multiples d’un élément n ; on voit que 
l’idéal (n) contient l’idéal (m) si et seule- 
ment si m lui-même est un multiple de n ; 
ainsi l’idéal (p) est maximal si et seulement 
s’il n’existe pas d’entier n ^ p divisant p 
et tel que {n) ^ A, c'est-à-dire n ^ ± 1 ; 
ainsi, dans l’anneau Z, les idéaux maxi- 
maux sont formés des multiples des nom- 
bres premiers. L’intérêt de la notion 
d’idéal maximal résulte surtout du théo- 
rème suivant, dû à Krull, et dont la 
démonstration utilise l’axiome du choix : 
« Dans un anneau, tout idéal à gauche 
différent de l’anneau tout entier est 
contenu dans au moins un idéal à gauche 
maximal. » Nous renvoyons à l’article 
algèbres normées pour voir un bel exemple 
de l’utilité de la notion d’idéal maximal. 

L’exemple des germes de fonctions, ou 
des anneaux de séries, nous montre 
l’importance des anneaux possédant un 
unique idéal maximal, qui est alors maxi- 
mum, c’est-à-dire qui contient tous les 
idéaux de l’anneau distincts de l’anneau 
lui-même. Dans le cas de l’anneau des 
germes de fonctions analytiques à l’ori- 
gine, les germes dont un représentant 
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(U, /) s’annule pour z = 0 (il en est alors 
de même de tous les représentants d’un tel 
germe) forment manifestement un idéal. 
Cet idéal contient tout idéal propre : en 
effet si g est une fonction analytique dans 
un voisinage de l’origine qui ne s’annule 
pas pour z = 0, il existe un voisinage U de 
O dans lequel g(z) ^ 0 et, par suite, dans 
lequel h (z) = l/g(z) est analytique ; ainsi 
le germe A, défini par g, a un inverse B 
dans l’anneau (c’est le germe défini par h) ; 
tout germe C est alors un multiple de A car 
C — (CB)A et le seul idéal contenant A est 
donc l’anneau des germes tout entier. On 
démontre également que tout anneau de 
séries possède un unique idéal maximal. 
Les anneaux de ce type, qui peuvent aussi 
être caractérisés par le fait que l’ensemble 
des éléments non inversibles est un idéal, 
sont appelés des anneaux locaux. 

Anneau quotient 

Les idéaux bilatères d’un anneau (ou d’une 
algèbre) A jouent un rôle fondamental 
dans l’étude des relations d’équivalence 
sur A compatibles avec sa structure 
d’anneau (ou d’algèbre). De manière pré- 
cise, toute relation d’équivalence telle 
qu’on puisse munir l’ensemble quotient 
d’une structure d’anneau (ou d’algèbre) 
pour laquelle l’application canonique (qui 
à un élément fait correspondre sa classe) 
soit un homomorphisme s’obtient de la 
façon suivante : il existe un idéal bilatère c ll 
tel que deux éléments x et y soient équi- 
valents si et seulement si leur différence 
x — y appartient à l’idéal € \l. Si X et Y sont 
deux classes, on définit leur somme, leur 
produit, et éventuellement leur produit par 
un scalaire À, en choisissant des représen- 
tants x et y de X et Y ; on vérifie alors (et 
ici intervient le fait que *11 est un idéal) que 
les classes X + Y, XY et ÀX des éléments 
.V -J- y, xy, et, éventuellement À* sont indé- 


pendantes des représentants x et y choisis 
et que l’ensemble quotient est un anneau 
(ou une algèbre) noté A/'IL pour les 
opérations ainsi définies. A s’appelle 
l'anneau quotient de A par Vidécil C U. Il est 
clair que si A est commutatif, alors 
l’anneau quotient par un idéal est encore 
commutatif. Avec ces notions, un idéal ‘U 
d’un anneau commutatif est maximal si et 
seulement si l’anneau quotient A / C \L est un 
corps. 

Anneau des entiers relatifs 
modulo n 

Nous allons maintenant indiquer un exem- 
ple fondamental d’anneau quotient qui 
montrera que le calcul des congruences 
dans l’anneau Z des entiers relatifs rentre 
dans la théorie des anneaux. 

Soit n un entier positif et considérons la 
relation d’équivalence définie par l’idéal 
(n) = nZ des multiples de n ; deux entiers 
x et y sont équivalents pour cette relation 
d’équivalence si, et seulement si, leur 
différence est un multiple de c’est-à- 
dire avec la terminologie classique en 
arithmétique, si x et y sont congrus modulo 
n (cette relation est notée x = y , mod. n) ; 
la classe d’un entier x s’appelle la classe 
résiduelle de x modulo n. D’après les 
propriétés du quotient d’un anneau com- 
mutatif unitaire par un idéal, l’ensemble 
ZjnZ des classes résiduelles modulo n est 
un anneau commutatif unitaire ; il en 
résulte en particulier qu’on peut appliquer 
aux congruences les règles usuelles du 
calcul algébrique. 

Dans l’anneau Z/«Z, les classes des 
nombres 0 , 1 , ..., n — 1 sont distinctes car 
la différence de deux tels nombres est 
inférieure à n en valeur absolue et par suite 
ne peut être un multiple de n ; réciproque- 
ment, tout nombre entier est égal à un de 
ces nombres à un multiple de n près. Cela 
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montre que Z/«Z est un anneau fini 
contenant exactement n éléments qui sont 
les classes 0, 1,..., n — 1 des nombres 
0, 1, — 1. Le tableau ci-joint donne 
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les tables d’addition et de multiplication 
dans les anneaux Z/2Z, Z/3Z et Z/4Z. On 
y remarque que Z/2Z est un anneau de 
Boole, car (Ô) 2 = 6 et (i ) 2 = i ; récipro- 
quement, on peut montrer que tout anneau 
de Boole sans diviseur de zéro est isomor- 
phe à l’anneau Z/2Z. Dans l’anneau Z/4Z, 
l’élément 2 est nilpotent car son carré est 
nul. L’anneau Z/3Z est un corps, car tout 
élément non nul a un inverse dans 
l’anneau. Montrons plus généralement que 
l’anneau Z//7Z est un corps si, et seulement 
si, p est un nombre premier. En effet, si p 
est un nombre entier positif non premier, 
p est le produit de deux nombres entiers q x 
et q 2 positifs et strictement inférieurs à p ; 
on a donc 0 = p = q x q 2 et Z/pZ n’est pas 
un corps car il contient des diviseurs de 
zéro. Réciproquement, si p est premier, 
tout nombre q > 0 plus petit que p est 


premier avec p et par suite il existe des 
entiers relatifs u et v tels que up vq == 1 
(théorème de Bezout) ; passant aux classes 
d’équivalence, on a ùp + vq = vq = 1 et 
par suite q est inversible, d’inverse v ; ainsi 
tout élément non nul de Z /(p) est inversible 
et cet anneau est un corps souvent noté 
(cf. CORPS). 

JEAN-LUC VERLEY 
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APPROXIMATIONS 


ASYMPTOTIQUES calculs 


I l est difficile de définir avec précision ce 
que l’on appelle méthodes asymptoti- 
ques en analyse mathématique. Ainsi, lors 
de l’étude d’une suite ou d’une fonction 
dont la nature est compliquée, certaines 
questions ne nécessitent que des rensei- 
gnements d’ordre qualitatif tels que 
/ (x) — 0 ou f(x) — * + oo pour x — ► + °°. 
D’autres exigent un contrôle quantitatif 
très précis, défini par des inégalités expli- 
cites. Les comportements asymptotiques 
relèvent d’une préoccupation intermé- 
diaire : dans de nombreux problèmes, on 
remplace la quantité étudiée par une autre 
plus simple sans que, « à la limite », le 
résultat soit modifié. Par exemple, la rela- 
tion 

suffit à établir la convergence à l’infini de 
l’intégrale de f Les exemples qui suivent 
montreront la nature de ces préoccupa- 
tions. 

Du point de vue strictement technique, 
les méthodes asymptotiques sont extrême- 
ment variées et, en dehors de quelques 
résultats relativement généraux, chaque 
cas particulier exerce l’ingéniosité de celui 
qui l’étudie. Nous nous limiterons, dans les 
chapitres 2 et 3, à l’exposé de quelques- 
unes de ces méthodes. 


* 


1 . Comparaison de la croissance 
des fonctions 

L’étude de la manière dont des quantités 
tendent vers l’infini ou tendent vers zéro 
a constitué, à la naissance du calcul 
infinitésimal, au xvn e siècle, la théorie 
des « infiniment grands » et de leurs 
inverses, les « infiniment petits », et a 
fait l’objet de polémiques passionnées, 
souvent paramathématiques. En effet, 
l’absence d’une conception précise de la 
notion de limite (problème qui ne fut 
pas abordé sous forme rigoureuse) ren- 
dait mystérieuse la nature de ces quan- 
tités qui, tout en étant comparables entre 
elles, n’étaient pas comparables aux nom- 
bres ou aux fonctions. De plus, cela 
représentait l’intrusion de l’infini dans 
les calculs et, bien que cet infini fût 
potentiel et non actuel (en ce sens que 
l’infini n’était pas considéré en lui-même 
comme un être mathématique soumis à 
des règles opératoires précises), cela sus- 
citait des problèmes philosophiques aux 
mathématiciens, échaudés par les nom- 
breux « paradoxes de l’infini » qui 
n’étaient pas encore clairement analysés. 
La recherche des « vraies valeurs » des 
formes indéterminées, rencontrées dans le 
calcul des dérivées par exemple, allait 
cependant montrer l’importance de ces 
notions et les justifier, tout au moins 
empiriquement, aux yeux des mathémati- 
ciens. Ces questions ont été systématique- 
ment élucidées par Paul Du Bois- 
Reymond, qui, dans une série d’articles de 
1870-1871, a posé les fondements du 
calcul des infiniment grands (Infinitâr- 
calcuî) en mettant en évidence l’impor- 
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tance de la notion d’échelle de comparai- 
son ; il a étudié également en détail 
l’intégration et la dérivation des relations 
de comparaison. Tous ces résultats ont 
trouvé leur forme rigoureuse et définitive 
dans les travaux de Hardy. 

Relations de comparaison 

Dans de nombreuses questions d'analyse, 
on est conduit à étudier l’« ordre de 
grandeur » d’une fonction f (h) d'une 
variable entière positive pour n grand, ou 
d’une fonction /(x) d’une variable conti- 
nue x lorsque x est grand, ou voisin d’une 
valeur a. Formulons le problème de 
manière précise, en nous limitant au cas 
d’une variable continue pour fixer les 
idées. 

Soit/ une fonction, à valeurs réelles ou 
complexes, définie pour a — h < x < a ou 
a < x < a + h (on dira alors que / est 
définie dans un voisinage à gauche ou à 
droite de a) ou pour x assez grand (on dira 
que / est définie au voisinage de l’infini). 
Par exemple, l’application : 

1 

x *—*■ » 

x — a 

transforme les voisinages à droite de a en 
les voisinages de l’infini et, par suite, on 
peut, en considérant la fonction : 



ramener l’étude de / au voisinage de a 
(à droite) à l’étude d’une autre fonction 
au voisinage de l’infini ; nous nous limi- 
terons à ce cas dans ce chapitre. Il est 
clair, d’autre part, que les notions 
ci-dessous s’étendent de manière évidente 
au cas où la variable ne prend que des 
valeurs entières. Nous nous proposons 
ici de montrer qu’il est possible de « com- 
parer » les fonctions définies au voisinage 


de l’infini lorsque la variable tend vers 
l’infini. 

Si / et g sont deux fonctions définies 
pour x assez grand et à valeurs non nulles, 
on dit que / et g sont asymptotiquement 
équivalentes pour x tendant vers l’infini, et 
on note : 

au voisinage de l'infini si le rapport 
/ (x)/g(x) tend vers 1 pour x tendant vers 
l’infini. Remarquons que cela n’entraîne 
même pas que la différence / (x) — g(x) soit 
bornée, comme le montre l’exemple des 
fonctions asymptotiquement équivalentes 
x 2 + x et x 2 au voisinage de l’infini. La 
recherche de fonctions équivalentes à des 
fonctions données et plus simples ou plus 
maniables est un problème essentiel 
(cf. Partie principale , in chap. 2) et qui peut 
être fort difficile ; ainsi, si 7r(x) désigne le 
nombre de nombres premiers < x, la « loi 
de répartition des nombres premiers », 
conjecturée par Gauss, qui exprime que : 

tt(x) ~ - — » * — > 
ln* 

est un résultat profond de la théorie des 
nombres, qui n’a été démontré qu’en 1896 
par Hadamard et de La Vallée-Poussin. 

Nous allons maintenant préciser com- 
ment on peut comparer les croissances des 
fonctions pour x — oo. On dit que / est 
asymptotiquement négligeable devant g , 
ou que g croît plus vite que f pour x tendant 
vers l’infini, si pour tout £ > 0, on a 
|/ (x) | < e | g(x) | pour x assez grand ; on 
écrit alors : 

f{x) = o{g{x)) 

(notation de Landau). 

Il est clair que la définition ci-dessus 
signifie que le rapport /(x)/g(x), s’il est 
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défini pour x assez grand, tend vers 0. 
Remarquons que le symbole de Landau 
doit être considéré seulement comme une 
écriture commode mais ne représente pas 
une fonction déterminée croissant moins 
vite que g et ne doit donc pas être manipulé 
comme les nombres ou les fonctions ; ainsi 
écrire que o(g) + o(g) = o(g) exprime 
que la somme de deux fonctions négligea- 
bles devant g est négligeable devant g, mais 
cela n’aurait aucun sens d’en conclure que 
o(g) = 0 ! Pour une formulation mathé- 
matique satisfaisante, on pourrait convenir 
que o(g) désigne Yensemble des fonctions 
négligeables devant g , qui est un espace 
vectoriel ; la notation / — o(g) est alors un 
abus de langage pour / E o(g). 

La notation précédente permet de tra- 
duire maintenant facilement les résultats 
sur la « croissance comparée » des fonc- 
tions puissance, logarithme et exponen- 
tielle ; ainsi, pour a < b, 

x° = o(x*>\ x — «>; 

pour a quelconque et b > 0, on a : 

(In*)* = o(x ft ), x — *•«, 

c’est-à-dire les fonctions puissance crois- 
sent plus vite que les fonctions logarithme. 
Enfin, pour a quelconque, c > 0 et d > 0, 

x* = o(e cxd ) 

au voisinage de l’infini, c’est-à-dire les 
fonctions exponentielles croissent plus vite 
que les fonctions puissance. 

Indiquons, pour terminer, une dernière 
notation fort utile. Dans de nombreux cas, 
on a besoin d’une relation de comparaison 
plus faible que la précédente, qui puisse 
s’appliquer à des fonctions dont la crois- 
sance n’est pas très régulière. S’il existe une 
constante M telle que |/(x) | < M | g(x) | 
pour x assez grand, on dit que / est 


dominée par g pour x tendant vers l’infini, 
et on écrit : 

/(x) — O (g(x)),x — 00 (notation de Landau) ; 

bien entendu, si / est négligeable devant g , 
elle est aussi dominée par g. Si g est la 
fonction constante L l’égalité / (x) = 0(1) 
exprime simplement que / est bornée pour 
x assez grand ; par exemple : 

sinx + - — O(î), x — ► 
x 

Le symbole O permet de préciser cer- 
tains ordres de croissance ; ainsi écrire 
que : 

/(*)=°(i), 

est plus précis que : 

/<*) = °Q), oo. 

Les Anglo-Saxons utilisent les notations 
de Hardy : 

f«g ou /(x)«g(x) 

pour /est négligeable devant g, ou : 

f< g ou f(x)^g(x) 

pour /est dominée par g. 

Fonctions de comparaison 
et échelles de comparaison 

Les fonctions les plus simples auxquelles 
on est tenté de comparer (au sens du 
chapitre 1) une fonction donnée, pour x 
tendant vers l’infini, sont les fonctions : 

x a (a réel), (ln x ) b ( b réel ^ 0), 
e cxd (c =7* 0 et d > 0) 

et les produits d’un nombre fini de telles 
fonctions. Remarquons au passage que, à 
l’exception de la fonction 1 (obtenue pour 
a = 0), chacune de ces fonctions tend vers 
0 ou vers l’infini lorsque x tend vers 
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l’infini ; de plus, d’après les propriétés de 
croissance comparée de ces fonctions, si / 
et g sont de ce type, on a une et une seule 
des trois relations : 

rn f/W = °te(*))» /(*)=*(*). 

y) [g(x) = o(f(x)) * — ; 

cette propriété signifie que deux fonctions 
distinctes / et g du type considéré ont des 
croissances que l’on peut comparer et ne 
font pas « double emploi », en ce sens qu’il 
n’existe pas de constante c telle que 
/(.Y) — Cg(A'), A- — * oo. De manière géné- 
rale, une famille E de fonctions définies et 
positives pour x assez grand peut être 
utilisée de manière profitable pour étudier 
la croissance d’une fonction quelconque si, 
quelles que soient /et g dans E, on a une 
et une seule des relations (1) ; on dit alors 
que la famille E constitue une échelle de 
comparaison pour x tendant vers l’infini. 
Bien entendu, toute partie d’une échelle de 
comparaison en est aussi une ; dans la 
pratique, on se limite à des échelles 
logarithmico-exponentielles constituées de 
fonctions du type considéré ci-dessus ou de 
composées (au sens de la composition des 
fonctions) de telles fonctions, par exem- 
ple : 

h 2 x — lnlnx, e 2 (x ) = exp(exp^c). 

On utilise souvent des échelles de compa- 
raison dénombrables ; l’exemple le plus 
simple est : 

(2) \,x~\ 

X — - oo, 

qui est décroissante , en ce sens que chaque 
terme est négligeable, pour x tendant vers 
l’infini, devant tous les termes précédents. 
Indiquons, pour terminer, que le choix 
d’une échelle de comparaison dépend 
essentiellement du type de fonction que 
l’on veut étudier et il serait illusoire d’espé- 


rer trouver une échelle dénombrable telle 
que toute fonction s’« intercale » exacte- 
ment dans l’échelle ; en effet, on peut 
montrer que, pour toute échelle dénom- 
brable, il existe une fonction qui croît plus 
vite que toute fonction de l’échelle (Du 
Bois-Reymond) et une fonction qui croît 
moins vite que toute fonction de l’échelle 
(Hadamard). 

Tout ce qui précède sur les relations de 
comparaison au voisinage de l’infini se 
définit de même pour les fonctions définies 
dans un voisinage (à droite par exemple) 
d’un point a : ainsi l’échelle de comparai- 
son qui correspond à (2) est dans ce cas : 

(3) — a)- 1 , 1, 

x — a , ..., {x — a ) n , ... 


2. Développements asymptotiques 

Dans ce chapitre, on supposera choisie une 
échelle de comparaison E (au voisinage 
d’un point a ou au voisinage de l’infini). 

Partie principale 

L’idée la plus simple pour étudier le 
comportement d’une fonction donnée / 
(au voisinage de a ou de l’infini) est de 
chercher si, à une constante près, elle est 
équivalente à une fonction de l’échelle E 
choisie. S’il existe une telle fonction g de 
E et une constante c ^ 0 telles que / — cg, 
c et g sont déterminées de manière unique 
et on dit que cg est la partie principale de 
/(par rapport à l’échelle E) ; remarquons 
que cela équivaut à dire que : 

f(x) = cg{x ) + o (g(x)) f 

ou encore que / (x)jg(x) tend vers une 
limite finie c 0. Dans le cas où l’échelle 
choisie est (2) ou (3), on retrouve la notion 
usuelle de partie principale ; ainsi, 1/sinx a 
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pour partie principale 1/x pour x— ►(), 
e v — e a a pour partie principale e a {x — a) 
pour x— »> a , 

2x l -h 1 
x — l 

a pour partie principale 2x pour x — » ► <». 
Remarquons que la partie principale 
n’existe pas nécessairement ; en effet, 
toutes les fonctions d’une échelle 
logarithmico-exponentielle sont positives 
pour x assez grand et par suite une 
fonction « oscillante » (comme x sinx, qui 
s’annule dans tout voisinage de l’infini) 
n’est comparable à aucune fonction de 
ce type, pour x — ► oc. Il se peut aussi 
que l’échelle choisie ne soit pas assez 
« riche » et que / croisse plus vite ou moins 
vite que toute fonction de l’échelle, ou 
encore tombe dans un « trou » de 
l’échelle : ainsi la fonction x ln x n’a pas de 
partie principale par rapport à l’échelle (2), 
car elle croît plus vite que x et moins vite 
que x 2 . 

Développements asymptotiques 
au sens de Poincaré 

Si / a une partie principale c l g l par 
rapport à une échelle E, on peut chercher 
à préciser un peu plus le comportement de 
f en étudiant la différence/ — c\g x ; si cette 
fonction a une partie principale c 2 g 2 , on a 
alors : 

/(*) = cig\(x) H- c 2 g 2 (x ) + o(g 2 (*)) f 

gï(x) = o fe,(x)). 

De manière générale, on appelle déve- 
loppement asymptotique (au sens de Henri 
Poincaré) dordre k dune fonction f par 
rapport à une échelle de comparaison E une 
somme finie (nécessairement déterminée 
de manière unique si elle existe) : 

g(x> = cigi(x) + c 2 g 2 (*)+...-i-c i -g l -(jc)+...c t gA(x), 

g, G E etg/ + i (x) = o(g 2 (x» 


telle que la différence /— g soit négligea- 
ble, les g, formant une suite « décrois- 
sante » de fonctions de E, en ce sens que, 
pour chaque la fonction g t + { est négli- 
geable devant g,. 

L’exemple le plus simple de cette situa- 
tion est la théorie classique des développe- 
ments limités au voisinage d’un point a : ce 
n’est autre que la recherche du dévelop- 
pement asymptotique d’une fonction par 
rapport à l’échelle (3). Le résultat classique 
le plus important est ici la formule de 
Taylor , qui affirme que toute fonction k 
fois continûment dérivable au voisinage de 
a admet le développement limité d’ordre 
k : 

f(x)=f{a)+f'(a)(x-a) + ... 

+ f— (x — af 4- o((x — a) k ), x—>a. 
k ! 


On obtient ainsi, pour les fonctions usuel- 
les de l’analyse, des développements limi- 
tés d’ordre arbitrairement grand ; par 
exemple, au voisinage de 0 : 


(1 + x) s = 1 + sx + ... 

s (s — 1 ) (5 — k + 1) 

+ 


x k + o(x*), 


e x - 1 + * + ... -|- + <>(■**)■ 


On trouvera de nombreux autres exemples 
dans l’article séries & produits infinis. 

Les résultats précédents permettent 
déjà d’étudier un grand nombre de formes 
indéterminées. 


3. Cas des intégrales 

Il s’agit d’étudier le comportement asymp- 
totique des restes des intégrales conver- 
gentes : 
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ou d’évaluer des intégrales divergentes : 

Cette étude s’effectue en deux étapes. 
On se ramène au cas où / appartient à une 
échelle classique de comparaison, grâce au 
théorème d’intégration des relations de 
comparaison : 

Théorème. Si / et g sont positives et 
équivalentes au voisinage de oo, alors : 

- dans le cas convergent : 

g(o*. 

- dans le cas divergent : 

J o 7(o*~ £*(»)*• 

Les énoncés sont analogues pour les 
relations/ = o (g-) et/= O (g). En revan- 
che, on ne peut pas toujours dériver les 
relations de comparaison ; par exemple : 

x^ 1 + x sin-^ — x , 

mais : 


De même, la fonction d’erreur, intro- 
duite par Gauss en calcul des probabilités, 

tend vers 1 si .y — ► + oo et son développe- 
ment asymptotique se déduit de la relation : 

ï + °°e- ta dt = e~ xZ (y 773 + - 

Il est important de ne pas confondre les 
développements asymptotiques avec les 
séries ; dans de nombreux cas, on n’est 
capable de déterminer explicitement qu’un 
petit nombre de termes et d’obtenir cepen- 
dant ainsi de très précieux renseignements 
sur les fonctions considérées. De toute 
façon, un développement asymptotique est 
essentiellement une somme finie et, même 
si on peut obtenir un nombre arbitraire- 
ment grand de termes, cela n’entraîne 
nullement que la série correspondante 
converge, comme le montre l’exemple 
suivant, étudié par Laplace. Considérons 
la fonction : 


, „ . 1 1 

1 + 2x sin cos- 

X X 



n’est pas équivalent à 1. 

Pour / appartenant à une échelle clas- 
sique, si on ne dispose pas d’une primitive 
explicite, on effectue des intégrations par 
parties successives. Par exemple, le com- 
portement asymptotique du logarithme 
intégral : 


(à une constante près, c’est la fonction 
« exponentielle-intégrale ») ; par intégra- 
tion successive par parties, on obtient 
facilement, pour tout k. 


^ 1 1 (* — l)l 


U). 




ÉL 

2 ln/’ 


étudié par Euler et Gauss, est donné par : 

p * a?/ _ x 1 !x 
J 2 ln/ lnx (lnx) 2 

(k — l)!x / x \ 
(lnx/ ° \(lnx)v* 


on constate facilement que, pour tout t, la 
série de terme général (k — \)\/t k est 
divergente. 

Dans l’exemple du logarithme intégral 
li (x) donné ci-dessus, on remarquera 
même que tous les termes du développe- 
ment tendent vers -j- 00 avec x ! 
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À travers les exemples précédents, on 
voit que le rôle de l’intégration par parties 
est de transformer l’intégrale à étudier en 
une intégrale négligeable devant la précé- 
dente. On peut expliquer le schéma de cal- 
cul de la manière suivante. Soit l’intégrale : 

JV(Os (0*. 

où / varie lentement devant g (par exemple 
fit) = 1 //, ou f(t) = In t, et g (/) = e\ 
g(t) — exp (— t 2 ), ou g (0 — e i{ ). En pre- 
mière approximation, on assimile / à une 
constante, ce qui conduit à l’estimation : 

JV(/)g (t)dt #f(x)G(x), 

où : 

G(x) = 

La non-constance de / se traduit par 
l’apparition d’un terme correctif portant 
sur la dérivée de f ce qui constitue la 
formule d’intégration par parties : 

= [/(()G(o]^-JV(r)G(0*. 

La faible variation de / se traduit par le fait 
que l’intégrale du second membre est négli- 
geable devant l’intégrale initiale. Dans les 
applications, on rencontre très souvent le 
cas de l’amortissement constant g (t) — e 
kt ou de la phase tournante uniforme 
g ( t ) = Ce double aspect amortisse- 

ment et phase tournante se retrouve dans la 
méthode de Laplace et dans la méthode de 
la phase stationnaire (cf. chap. 5). 

4 . Cas des séries 
Généralités 

Le cas du développement asymptotique 
des sommes partielles des séries est ana- 


logue à celui des intégrales. Il s’agit d’étu- 
dier le comportement asymptotique des 
restes de séries convergentes : 

p= n + 1 

et des sommes partielles de séries diver- 
gentes : 

Z /0 °- 

p = ° 

Ici encore, on se ramène au cas où / 
appartient à une échelle classique, grâce au 
théorème de sommation des relations de 
comparaison : 

Théorème . Si f et g sont positives 
et équivalentes au voisinage de + oo, 
alors : 

- dans le cas convergent : 

g(pi 

p — n + 1 p — n + 1 

- dans le cas divergent : 

^J(p) - 

p — 0 p = 0 

Enfin, lorsque / appartient à une 
échelle classique, on compare les som- 
mes précédentes à des intégrales. Cette 
comparaison est facile lorsque f varie 
« lentement » ; plus précisément, on 
a : 

Théorème de Hardy. Soit / une fonction 
à valeurs complexes de classe C 1 , pour 
x > 0, telle que sa dérivée /' soit inté- 
grable au voisinage de -f- oo. Alors, la 
suite : 

]r/o>)-j o 7(o<* 

P = 0 

est convergente. 
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Par exemple, la suite : 

Zh- 

P = 1 

admet une limite, traditionnellement notée 
Y et appelée constante d’Euler. Ce nombre 
est de nature encore très mystérieuse et on 
ne sait même pas s’il est rationnel ou 
irrationnel. Une valeur approchée à 
20 décimales est : 

0,57721 56649 01532 86060. 

Formule sommatoire 
d'Euler-Maclaurin 

Si l’on désire un développement asympto- 
tique à une précision plus grande, on fait 
appel à une technique beaucoup plus 
élaborée, la formule sommatoire d’Euler- 
Maclaurin. On suppose ici que / est 
suffisamment dérivable et que, pour tout 
entier k , la dérivée /:-ième f {k) est négli- 
geable devant f Kk " X) . 

On se propose d’évaluer des sommes du 
type : 

2> 

n=p+\ 

par comparaison avec l’intégrale : 

J* f (/)<*• 

Plus précisément écrivons : 

<7 

» =P+ 1 

= Z 

n=p + 1 

on se ramène d’abord à l’intervalle [0, 1] 
pour chacune des intégrales de la somme 


de droite par les changements de variable 
u-\-n — \ = î. On a, pour chacune de ces 
intégrales : 

J"_, [ /' ( » ) — mv< 

= | 'W(n)-/(u + n-\)]du 

= [/■(„- 1)-/(„)]P,(0) 

+ JV(» + « — 1)P,(«M« 

après intégration par parties, en prenant 
une primitive P] du polynôme constant 
P 0 = 1 . De même, en prenant une primi- 
tive P 2 de P b on a, par intégration par 
parties : 

JV'O + n — 1)P](m ) du 

= [/■'(« +«-i)p 2 («)]] 

— JV ”{u + n — 1)P 2 (m ) du. 

On poursuit ce processus jusqu’au rang 
r, c’est-à-dire jusqu’à un reste portant sur 
/ (r+1) , et on choisit les primitives succes- 
sives P k de P 0 = 1 de telle sorte que les 
termes tout intégrés disparaissent deux à 
deux dans la sommation lorsque n varie de 
p + 1 à q. Il suffit pour cela d’imposer au 
polynôme P k de vérifier les relations : 
P'k = Pa-i P our k > 1 et P Â . (1) = P /v (0) 
pour k > 2, ou, ce qui revient au même, 
pour tout k > 1, 



On démontre qu’il existe une suite (P*) 
et une seule satisfaisant à ces conditions. 
Plus précisément, pour tout entier naturel 
k. 
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où B k est le /:-ième polynôme de Bernoulli, 
considéré par Jacques Bernoulli comme 
solution de l’équation aux différences : 
P(x + l) — P(jc) = kx*- 1 . Ces polynômes 
peuvent être introduits par la série géné- 
ratrice formelle : 


On en déduit les développements en 
séries entières des fonctions trigonométri- 
ques : 

cotg z = l = 1} " 22 " (fe z2 " -1 ’ 

« = 1 



IJ = 0 


En fait, dans ce qui précède, 
seuls interviennent les nombres de Ber- 
noulli p A . = B Â .(0). En particulier, p 0 = 1, 
p 1 =-l/ 2 ,P 2 p+I = 0 sip> 1 , P 2 = 1 / 6 , 
P 4 — “ 1 / 30 , p 6 = 1 / 42 , P 8 = — 1 / 30 , 
Pio = 5 / 66 . 

Pour expliciter les calculs précédents, il 
convient de distinguer deux cas, suivant 
que : 

/ est intégrable au voisinage de + oo ; 
il s’agit alors d’évaluer le reste : 


t g z = y (— iy-' 2^ (2 2n — i) 


h, 

(2n)! 2 


J_ = i + Y(_,),- 1 2(2- l _l)-|V 

sinz z ZS (2«)f 


La formule d’Euler-Maclaurin s’appli- 
que à l’évaluation de sommes portant sur 
une fonction /dont les dérivées décroissent 
de plus en plus. Les cas les plus fréquents 
en mathématiques appliquées sont ceux où 
/présente un amortissement constant, une 
phase tournante constante, et la situation 
mixte. Par exemple, supposons que l’on 
veuille évaluer : 


5 >> 

» =P + 1 

/ n’est pas intégrable ; il s’agit alors 
d’évaluer la somme partielle : 

£/<->■ 

n = 0 

Il convient de noter que la formule 
sommatoire d’Euler-Maclaurin est de type 
asymptotique, c’est-à-dire que les restes ne 
tendent pas nécessairement vers 0. Mais, 
lorsque ce reste tend vers 0, la formule 
sommatoire fournit des développements 
en série. Ainsi, appliquant cette formule à 
la fonction t e :t , on montre que, pour 
\ 2 | < 2 TT, 


V* izü 

7 . n a 

n=p+l 

avec z — x -f- iy, x > 0 (z =£ likit) et 
a > 0. On peut penser à comparer e~ nz j n a 
à l’intégrale : 



Or, en première approximation, 1 /?* varie 
peu sur [n — 1 , n\ tandis que e~ rz présente 
de manière mixte un amortissement et une 
phase tournante, ce qui conduit à l’esti- 
mation : 



Autrement dit, le terme e~ tlz j n a est multi- 
plié par un facteur constant dû à l’amor- 
tissement et à la phase. L’estimation pré- 
cédente permet de conjecturer : 


z 

e z ~i 



n = 0 



n=p+ 1 
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pour établir rigoureusement cette relation, 
il faut évidemment remplacer l’estimation 
(1) par une intégration par parties comme 
indiqué supra. 


5 . Cas des fonctions définies 
par des intégrales 

Nous dégagerons ici trois méthodes impor- 
tantes pour étudier le comportement 
asymptotique d’intégrales dépendant d’un 
paramètre lorsque ce paramètre tend vers 
l’infini. 

La méthode de Laplace 

Considérons une fonction : 

1(0 = J 6 g (x )e Ih M dx, 

définie par une intégrale ; {a, b) est ici un 
intervalle quelconque, borné ou pas. Pour 
simplifier, nous supposerons que la fonc- 
tion h admet un seul maximum. L’idée 
essentielle ici est que, sous cette hypothèse, 
c’est la partie de l’intégrale située au 
voisinage de ce maximum qui est prédo- 
minante pour t grand ; par suite, si on 
remplace la fonction g (x) e !hix) par sa 
partie principale au voisinage de ce point, 
il est plausible que l’on obtienne, par 
intégration, la partie principale de I(/) pour 
t tendant vers l’infini. Nous nous limite- 
rons à un cas particulier simple où le 
raisonnement ci-dessus est applicable. Plus 
précisément : 

Théorème L Soit g et h deux fonctions 
continûment dérivables dans un intervalle 
[t a , b[ borné ou pas (on suppose cependant 
a fini) telles que g (x) e tl ^ x) soit intégrable 
sur [ a , b[ pour t assez grand. Supposons de 
plus que la fonction h admet un maximum 
pour x = a tel que JT (a) — 0, JT r (a) < 0, 


et g(a) — 0 et que le maximum de h(x) 
dans tout sous-intervalle [a\ b[, avec 
a' > a , est inférieur à h(a) ; on a alors : 

J è g (x)e th(x) dx 

~ g{a)e ' Ha) nTÎy 


Par exemple, si : 


I «(0 = 


1 



cos nx dx. 


on obtient : 


1 .( 0 - 


V2rr/’ 


oo. 


Donnons également une application à 
la fontion gamma d’Euler : 



qui extrapole la factorielle, à savoir, pour 
n entier naturel, T(n -j- 1) = n !. Après 
changement de variable u = a 7, on 
obtient : 


T(t + 1) = r' + ‘ 



+ l * x '*dx, 


où l’intégrale est la forme ci-dessus avec 
h(x) — lnA — x. La fonction h admet un 
unique maximum pour x = 1 dans l’in- 
tervalle (0, + oc) et h"( 1)= 1; appli- 

quant le théorème 2 à chacun des inter- 
valles (0,1) et (1 , + oc), ce qui revient 
à multiplier par 2 la formule du théo- 
rème 1, on obtient la célèbre formule de 
Stirling : 

f(f + 1) — V2 t xt e— 1 V , ? — * 


qui précise le comportement asymptotique 
de la fonction gamma lorsque t tend vers 
l’infini. Le développement asymptotique 
de In T peut être obtenu par la formule 
d’Euler-Maclaurin. 
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La méthode de la phase 
stationnaire 

La méthode de la phase stationnaire a été 
utilisée par lord Kelvin en 1887, à propos 
de problèmes d’hydrodynamique, pour 
étudier des intégrales du type : 

1(0 — J è g (x)e itk(x '>dx, 

où g et h sont des fonctions très régulières 
dans (tf, b) ; dans les applications physi- 
ques, g (.y) apparaît comme l’amplitude et 
th(x) comme la phase du phénomène 
considéré. L’idée essentielle de Stokes et 
Kelvin est que la partie prédominante de 
l’intégrale pour t tendant vers l’infini est 
obtenue au voisinage des extrémités de 
l’intervalle d’intégration et surtout au voi- 
sinage des points c où la phase est « sta- 
tionnaire », c’est-à-dire tels que h' (c) = 0. 
Intuitivement, lorsque t est grand, le point 
g (x) e ith{x) tourne « très vite » autour de 0 
dans le plan complexe au voisinage de tout 
point c de T intervalle ( a , h) tel que 
h'(c) 0, et cela a pour conséquence de 

rendre « petite » la partie correspondante 
de l’intégrale ; si maintenant h'(c) = 0, la 
phase est stationnaire au voisinage de c, 
c’est-à-dire que cette rotation est très 
ralentie et la contribution de l’intégrale au 
voisinage d’un tel point est prédominante 
sur le reste. Ce principe peut présenter de 
nombreux aspects ; nous nous limiterons, 
à titre indicatif, à deux énoncés mettant en 
évidence le rôle joué par les extrémités de 
l’intervalle d’intégration, d’une part, et par 
la présence de points où la phase est 
stationnaire, d’autre part. En fait, c’est la 
contribution de ces derniers qui est pré- 
pondérante sur la contribution des extré- 
mités. 

Théorème 2 (rôle des extrémités de l’inter- 
valle d’intégration). Soit g et h deux 


fonctions indéfiniment dérivables dans 
l’intervalle compact [ a , b]. Si la fonction h 
n’a pas de point stationnaire dans l’inter- 
valle, on a : 



e ith < x )dx 


_ S {b ) ith(h ) 
ith\b ) 


g(g) 
it h '{a ) 


e ith{a) O 





Théorème 3 (rôle des points où la phase est 
stationnaire). Supposant encore que g 
et h sont indéfiniment dérivables dans 
l’intervalle compact [a, b ], nous suppose- 
rons, de plus, que h' s’annule en un seul 
point c de cet intervalle avec g (c) ^ 0 et 
h "( c ) ^ 0. Alors on a, pour t tendant vers 
l’infini : 


r 

V 2 th" 


1(0 = 


(O 


§(c )é? h( c )g‘ ir 


■o(î) 


si h " (c) > 0, 


+ °(i) 


si h " (c) < 0, 


Nous renvoyons aux ouvrages spécialisés 
pour l’étude détaillée des cas obtenus 
par superposition des phénomènes 
ci-dessus et pour le cas des intervalles non 
compacts. 


La méthode du col 

Cette méthode a été utilisée par Riemann 
en 1863 pour étudier le comportement 
asymptotique de la fonction hypergéo- 
métrique et Debye l’a systématiquement 
développée dans deux mémoires de 1909 
et 1910. Il s’agit d’étudier, pour t réel 
tendant vers l’infini, des intégrales du 
type : 



g(z) e th ^dz, 


où L est un chemin, fini ou pas (pouvant 
dépendre de /), contenu dans un ouvert D 
du plan complexe dans lequel g et h sont 
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des fonction analytiques. Le théorème de 
Cauchy montre qu’on peut, dans de nom- 
breux cas, modifier le chemin L sans 
changer la valeur de l’intégrale ; la 
méthode du col consiste à profiter de cette 
possibilité en choisissant un chemin L' sur 
lequel la fonction w(z) = \ e th{:) \ — e tReh{:) 
n’atteigne son maximum qu’en un seul 
point, dans des conditions qui permettent 
d’appliquer la méthode de Laplace (un peu 
modifiée pour tenir compte du fait que h 
prend des valeurs complexes). Intuitive- 
ment, on choisira le chemin L' passant par 
un point z 0 de telle sorte que, sur L' au 
voisinage de ce point, la phase Im h(z) 
varie peu, alors que l’amplitude w(z) 
décroît assez vite. Indiquons l’aspect 
géométrique de cette question, ce qui 
justifiera la terminologie utilisée. Consi- 
dérons dans l’espace à trois dimensions 
la surface d’équation z = w (x + iy ) 
_ e tR*h(x+iy), appelé le relief de e th(= \ Cette 
surface ne présente pas de « sommet » 
relatif, d’après le principe du maximum 
pour les fonctions analytiques, et, par 
suite, les seuls points où le plan tangent 
est horizontal (ce sont les points où la 
dérivée h\z) s’annule), sont des cols ; on 
dira donc qu’un point z 0 du plan complexe 
tel que h'(z 0 ) — 0 est un col ; l’ordre du col 
est, par définition, le nombre m tel que : 

h’(z 0 ) = ... = h >(z 0 ) = 0, 

A(" + ïïCzq) =5* 0. 

Revenons à l’interprétation géométri- 
que ; les lignes de niveaux du relief (c’est- 
à-dire les courbes vr — O e ) ont pour pro- 
jection sur le plan des z — x + iy, les 
courbes sur lesquelles R eth(z) reste cons- 
tant ; les lignes de plus grande pente du 
relief, qui sont orthogonales aux lignes de 
niveau, ont pour projection les courbes du 
plan complexe sur lesquelles la partie 
imaginaire de th(z) reste constant. Le long 


d’une telle courbe, e !h(:) a une phase 
constante, alors que son module varie « le 
plus vite possible », car les lignes de plus 
grande pente sont les lignes de gradient du 
relief. Limitons-nous, pour simplifier, au 
cas d’un col d’ordre 2. Par un tel point 
passent deux lignes de niveau et deux lignes 
de plus grande pente, la ligne de faîte, qui 
suit la crête, et la ligne de thalweg, qui 
descend dans la vallée. L’idée, ici, est 
essentiellement de chercher une ligne L' 
qui passe par un seul col et qui soit aussi 
proche que possible (au voisinage de ce 
col) de la projection de la ligne de thalweg ; 
en effet, sur cette dernière, la phase de e fh{:) 
reste constante et le module de e th(=) 
présente un maximum au col. Si on sait 
trouver une telle ligne, la méthode du col 
consiste à remplacer l’intégrale étudiée par 
l’intégrale prise le long d’un petit segment 
de la tangente à la ligne de thalweg du col, 
et de remplacer g et h par leurs dévelop- 
pements aymptotiques dans cette inté- 
grale. 

Donnons un exemple significatif de 
cette méthode. Dans ce qui suit, nous 
considérerons seulement des chemins infi- 
nis L : 


s — *■ r (s)e , '*p<0 J 

définis pour — oo < s < + oo, et satisfai- 
sant aux conditions (A) : 


et : 


lim r (s) = + °° 


2 7T , . 2 7T 

-y < <P(0 < y + 


n 
6 ’ 


au voisinage de + oo ; 


lim r (s) = + °° 


2 TT 

~Y 


— ^ < <p(D < — 


2 7T 


au voisinage de — oo (cf. figure). 
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On voit facilement, en appliquant le 
théorème de Cauchy et en passant à la 
limite, que l’intégrale d’Airy, introduite en 
1838 par Airy dans ses recherches sur 
l’optique : 

m * 2 ) = é^l^ v{tlw ~\ w ' )dw 

ne dépend pas du chemin L, pourvu 
qu’il satisfasse aux conditions (A). Effec- 
tuant le changement de variable : w = tz , 
on a : 


Ai (* 2 ) = ^ J L ex P (f 3 » dz ' 

où le chemin Lj = H L satisfait encore 
(A) ; appliquons la méthode du col à cette 
intégrale. La fonction h(z) — z — z 3 / 3 a 
pour dérivée Iï(z) = 1 — z 2 , d’où deux cols 
z 0 = -|- 1 et z 0 = — 1 . Ici, la ligne de faîte 
passant par z 0 est Taxe réel, et la ligne de 
thalweg est la branche L' de l’hyperbole 
1 — x 2 + j 2 /3 = 0 telle que x < 0 
(cf. figure). Ce chemin satisfait aux condi- 
tions (A) et on peut ici prendre exactement 
la ligne de thalweg comme nouveau che- 
min d’intégration sans changer la valeur de 


l’intégrale. Remplaçant alors L' au voisi- 
nage du col z 0 = — 1 par le segment 
tangent w — ► — 1 -f- iu, — r < u ^ -f- r, et 
h(— 1 + iu) par les deux premiers termes 
de son développement de Taylor — 2/3 — 
w 2 , on obtient l’intégrale : 


La formule de Laplace, appliquée à 
chacun des deux intervalles [ — r, 0] et [0, r] 
donne : 



d’où finalement : 


Aiù 2 ) ~ 


e —’ u 3/3 

2 VTt ’ 




6. Cas des solutions d'équations 
différentielles 

On se bornera aux systèmes d’équations 
différentielles linéaires, en distinguant deux 
cas, le champ réel et le champ complexe. 

Systèmes dans le champ réel 

Plaçons-nous d’abord dans le cas d’un 
système linéaire à coefficients constants : 

(1) x' = Ax, 

où A est une matrice carrée d’ordre n à 
coefficients complexes et x : t ► x (t) une 
fonction de classe G 1 sur [0, oo [ à 
valeurs dans C". Pour toute condition 
initiale a E C\ l’unique solution du pro- 
blème de Cauchy v(0) = a est donnée par : 

x(t) = (exp îA ) a 

(cf. équations différentielles). Lorsque 
A est diagonalisable, de valeurs propres 
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Aj ...., A,., le comportement asymptotique 
de x(r) est gouverné par la valeur propre 
de plus grande partie réelle. En parti- 
culier, les solutions tendent vers 0 à l’infini 
si et seulement si, pour tout y, on a 
Re < 0. Lorsque A n’est pas diago- 
nalisable et que A- est d’indice n jf il existe 
des solutions se comportant comme 
où 0 ^ k ^ rij — 1 . Les solutions tendent 
encore vers 0 à l’infini si et seulement si 
Re À ; < 0. 

Examinons maintenant l’effet d’une 
perturbation t »— ► R (t) de A sur le com- 
portement asymptotique d’une solution du 
système linéaire (1). On peut conjecturer 
que, si la perturbation est assez petite à 
l’infini, ce comportement n’est pas nota- 
blement modifié. Plus précisément, suppo- 
sons A diagonalisable et soit À une valeur 
propre de A. Si l’intégrale : 

est convergente, alors, pour tout vecteur 
propre b de A associé à la valeur propre A, 
il existe une solution x et une seule de 
l’équation perturbée : 

= (A + R)x 

telle que x(t) ~ e Xt au voisinage de + oc. 

Par exemple, soit l’équation de Bessel 
réduite (cf. fonctions de bessel, pour ce qui 
suit) : 

U" +(1-^)K =0, 
qui équivaut au système linéaire : 

*1 

V 2 

X 2 = — (!—_)*! ; 

ici : 



Les fonctions t ► e il , et / »— ► e~ il cons- 
tituent une base de l’espace vectoriel des 
solutions de l’équation non perturbée 
u" + u = 0. D’après le résultat précé- 
dent, il existe donc un couple (u h u 2 ) de 
solutions et un seul de l’équation perturbée 
tel que : 

u j(0 ~e lt y u 2 {t)~e~ it \ 

cette méthode donne donc le comporte- 
ment asymptotique des fonctions de Bes- 
sel. 

Si, maintenant, A n’est pas diagonali- 
sable, il convient d’imposer à R des 
conditions plus strictes. Lorsque A } est 
d’indice n f , on suppose que : 

jS*;- 1 ! R(/) \\dt <+<*>, 

ce qui entraîne l’existence d’une solution x 
telle que : 

x(t ) — t n J~ l e x j l b. 

Pour le comportement asymptotique 
des systèmes linéaires à coefficients pério- 
diques (par exemple, le théorème de 
l’équation séculaire des planètes), on se 
reportera à l’article équations différen- 
tielles, La théorie de Floquet. 

Le champ complexe 

Pour obtenir des développements asymp- 
totiques des solutions d’un système diffé- 
rentiel dans le champ complexe, l’idée 
principale consiste à obtenir des représen- 
tations intégrales des solutions. On utilise 
ensuite des développements tayloriens ou 
on applique à ces intégrales les méthodes 
esquissées au chapitre 5. 

Considérons, par exemple, une équa- 
tion différentielle linéaire d’ordre n : 

a Q (z)uW + a i(z)u ("—U + ... + a„(z)« = 0, 
où û 0 , ..., a„ sont des polynômes. 
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Pour obtenir des représentations inté- 
grales des solutions, les méthodes sont très 
variées. Citons, par exemple, la méthode 
de Laplace, qui s'applique lorsque les 
polynômes üj sont de degré ^ 1 : on 
cherche les solutions sous la forme : 

u (z) = 

où L est un contour du plan complexe 
convenablement choisi. 

Ainsi, dans le cas de l’équation différen- 
tielle : 


u" — zu = 0 

on trouve v(z) = exp(— C 3 /3) et : 

u (Ç) = exp(Çz — i C 3 ) C, 

où L est le contour décrit dans l’intégrale 
d’Airy (cf. La méthode du col , in chap. 5). 
Le comportement asymptotique de la solu- 
tion s’en déduit. 

On utilise aussi la méthode d’Euler, 
où : 


M (Z) = J\(Ç)(C— 


équation se ramène à l’équation hypergéo- 
métrique : 


,, ^d 2 u . , , , du 

z(l— z) — + [c — {a + b + l)z } — — abu = 0, 


où a , h , c sont des nombres complexes. 
Lorsque c n’est pas un entier négatif, pn 
obtient une solution holomorphe dans le 
disque | --i< i par la série entière, dite 
hypergéométrique : 


^ , a. b a(a + 1)6 (ô + 1) 

F(û, b,c,z) = 1 + - — z H — — - — ■■ - z 

1 .c 1.2 .c(c -I- 1) 

a (a + l)(g + 2)6 (6 + 1)(6 + 2) 

1.2.3.c(c + l)(c + 2) 


qui s’écrit aussi : 


r(g)r(6) 

L(c) 


F(g, b,c,z) 


Z T (a + k) r(6 + «) _„ 
r(n + l)r(c + n) z ’ 


où r désigne la fonction gamma 
d’Euler (cf. fonction gamma). 

On peut prolonger analytiquement 
F (a, h , c, z) au plan fendu C — R + par 
la représentation intégrale de Mellin- 
Barnes : 


pour un choix convenable de a et L. Une 
variante est la méthode de Mellin, où : 

u (z) = J L v(0(l-Cz) a tfC. 

Nous nous bornerons à deux exemples 
significatifs, importants pour les applica- 
tions. 

l/équation hypergéométrique 

Considérons l’équation de Riemann 
(cf. Les équations différentielles de la phy- 
sique mathématique, in chap. 2 de équa- 
tions différentielles), admettant trois 
points singuliers deux à deux distincts. Par 
une transformation homographique, cette 


T(a)r(b) 

T (c) 


F (a, b,c,z ) 


1 p r(g h- ç) r (6 + c) r<— p 
2/ 7T Jd T(c + 0 


où D désigne l’axe imaginaire et (— z) c 
= exp (Ç In (— z)) en prenant la détermi- 
nation principale du logarithme, c’est-à- 
dire | arg(— z)) | < TT. 

Cette représentation intégrale permet 
alors d’obtenir la relation suivante : 


r (p)T(b) 
r (c) 
mr(a-b) 


r (a-c) 
T(b)r(b-a) 


F(g, b,c,z) 

( — z)—' 3 F(a, 1 — c + a; 1 — è-j-gjz --1 ) 


r (6-0 


(_ 2 )-*F(6, 1— c + b; 1 —a + 6;z~ 1 )> 
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qui fournit aussitôt le développement 
asymptotique de F(cu b , c, z) au voisinage 
de l’infini sur C — R + . 


L'équation hypergéométrique confluente 

L’équation hypergéométrique confluente 
est le cas où deux des trois singularités de 
l’équation de Riemann confluent en un 
même point. Ici encore, on se ramène au 
cas où ce point est à l’infini et où l’autre 
singularité est au point 0. On obtient alors 
l’équation de Whittaker, qui s’écrit : 


dhi 
d ^ 


( 1 k 

(-4 + I + 


1— 4m 2 


4 z 2 



où k et m sont des nombres complexes. La 
méthode de Laplace ou celle de Mellin 
fournissent une solution de la forme : 


W k , m (2) - 


T(î4 — k + m) 




e—*dt. 


sous condition que Re(k — !4 — m) < 0, 
qui est holomorphe dans le plan fendu 
C — R . Cette fonction est appelée fonc- 
tion de Whittaker. En développant : 



Vi + m 


en série de Taylor, on obtient le dévelop- 
pement asymptotique de W,, m au voisi- 
nage de l’infini sur C — R . 

De nombreuses fonctions classiques 
apparaissent comme des cas particuliers 
des fonctions de Whittaker. Ainsi, la fonc- 
tion d’erreur : 


Er/(x) = 1 ^exp 

VTÏX 





Il en est de même pour le logarithme inté- 
gral. Enfin, l’équation de Bessel réduite : 


u" + 



1 — 4v 2 
4z 2 


> 


= 0, 


est satisfaite par W 0 et W ÜJf (- - z). La 
décomposition de la fonction de Bessel J v 
dans cette base (cf. fonctions de bessel) 
s’écrit : 


TOO = Vfro[ w °. v(2/z)exp (^ v + ^ 7r/ ) 

+ w o,v(— 2/z)exp( — i(v -f 2 )™)]’ 

ce qui fournit un développement de J v à 
toute précision. 

JEAN-LOUIS OVAERT et JEAN-LUC VERLEY 
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BARYCENTRE 


S oit A un espace affine attaché à un 
espace vectoriel E (sur un corps com- 
mutatif K). On appelle « point M de A 
affecté de la masse A » l’élément (M, À) de 
l’ensemble A X K. 

Par définition, le barycentre de n points 
M,, M 2 , M w de A affectés des masses À,, 
À 2 , À„ de somme non nulle est le point 
G tel que : 

X,. GM, - o. 

i = i 

De cette définition découlent aisément 
plusieurs propriétés : 

1 . Pour tout point O de A, on a la relation 
(équivalente à la condition de définition) : 

( a,) og - x, om,. 

i = 1 * = 1 

2. Le barycentre de la famille (M„ À,) est 
le même que le barycentre de la famille des 
(M,, oikj), où a est un élément non nul de 
K. 

3. Propriété d’associativité : soit G le 
barycentre de n points M h M 2 , M„ de 


A affectés des masses X h À 2 , X„ et soit 
G' le barycentre des points M,, M 2 , M k 
affectés des masses À b À 2 , X k . Alors G 
est aussi le barycentre des points G', M k+1 , 
..., M„ affectés des masses : 

k 

â ‘ +i ’ Xb - 

/ = i 

Lorsque le corps K est de caractéristi- 
que 0 et que les scalaires À, sont égaux, le 
barycentre G s’appelle centre de gravité, 
ou équibarycentre de la famille des (M,, À,). 

JACQUES MEYER 


BESSEL FONCTIONS DE 

L es fonctions de Bessel jouent un rôle 
important en mathématiques appli- 
quées et en physique mathématique. Elles 
interviennent aussi bien dans des problè- 
mes de conduction de la chaleur que dans 
des problèmes de diffraction, acoustique, 
ou électromagnétisme. Elles apparaissent 
souvent dans l’étude d’équations différen- 
tielles ou d’équations aux dérivées partiel- 
les avec des conditions aux limites relatives 
à des frontières sphériques ou cylindri- 
ques. Ces fonctions possèdent certaines 
analogies avec les fonctions trigonométri- 
ques : comportement à l’infini, zéros, 
développement en série. 

Définitions 

Considérons l’équation différentielle : 

(1) y" +\y' + ( 1 -^ = °, 
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dans laquelle v est un paramètre complexe 
quelconque. Les fonctions de Bessel, ainsi 
que d’autres fonctions voisines, les fonc- 
tions de Neumann et de Hankel, sont des 
solutions particulières de cette équation 
différentielle. Supposant que x est une 
variable réelle positive, cherchons des solu- 
tions de la forme : 



k = 0 


Par identification terme à terme, on 
obtient : 


(a 2 - v*) c 0 = 0, 

[(1 + a) 2 — v 2 ] ci = 0, 

[(& -I- a) 2 — v 2 ]c* + c k _ 2 = 0, k ^ 2 ; 

donc, on doit avoir a = + v. 

Si on choisit a = v, on trouve : 

Cik = (— i y 22k k ! (v + 1)...(V + k) ’ 


vérifie que J v satisfait à l’équation diffé- 
rentielle donnée. Si v est entier, J v peut 
être définie pour tout x complexe. Si v 
n’est pas entier, on peut étendre le 
domaine de définition de J v à l’ensemble 
des .v complexes non nuis, mais l’origine 
sera un point critique à cause du facteur 
(*/ 2 ) v . 

Si v n’est pas entier, la solution a = — v 
fournit la fonction : 


•-«-(ri 

k = 0 


(-i)* 

k ! r (k — V + 1) V 2 / ’ 


J_. v est encore une solution de l’équa- 
tion différentielle (1), et on vérifie que J v 
et J v sont linéairement indépendantes. La 
solution générale de (1) est donc : 

aJ v (*) + PL_ v (x), 


a et p étant deux constantes arbitraires. Si 
v est un entier n, on constate que : 


on est alors amené à choisir : 


J_„ (*) = (-!>■ J, (x). 


1 

c ° “ v r (v + i) ’ 


d’où : 


c 2k ( V 2 2k k\T(k + V+1)’ 

T désigne ici la fonction eulérienne ; c’est 
une fonction continue qui a pour pro- 
priété fondamentale T(« + 1) = n ! pour 
n entier (cf. fonction gamma). 

Par définition, la fonction de Bessel J v , 
d’indice v, est donnée par ces coefficients, 
soit : 




Tous ces faits peuvent être justifiés 
en remarquant que l’équation différen- 
tielle (1) est une équation du type de 
Fuchs (cf. équations différentielles), 
dont l’équation déterminante est a* 2 + v 2 
— 0. La différence des racines de l’équa- 
tion déterminante est 2v. Si 2v n’est pas 
entier, on a une base de la forme ,v v A(x) 
et x v B(x), A(a) et B(a') étant deux 
fonctions holomorphes au voisinage de 
x — 0. Si 2v est entier, on n’obtient 
ainsi qu’une seule solution x v A(x). Pour 
obtenir une deuxième solution dans ce 
cas, on est amené à introduire les fonc- 
tions de Neumann. On appelle fonction 
de Neumann d’indice v, N v , la fonc- 
tion : 


La série qui intervient dans la défi- 
nition de J v converge pour tout x réel et on 


N v (x) = CQS V1Ï Jy (* ) — J-v (•* ) 
sin vit 
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pour v non entier et : 

N n (x) = limN„ + e (x), 

pour n entier. On vérifie alors que, pour 
tout v, la fonction de Neumann est une 
solution de (1) et que N„ et J„ sont 
linéairement indépendantes. Donc, si n est 
entier, la solution générale de (1) est : 


Voici une application de ces for- 
mules. 

On vérifie directement que : 



aJ„ + f3N„. 

Enfin, on introduit parfois les fonctions 
de Hankel : 


HJ - J v + /N v , 

Hl = J v — zN v ; 

que v soit entier ou non, Hj, et H 2 forment 
une base de solutions de (1). 

Propriétés principales 

Formules asymptotiques . Le comporte- 
ment à l’infini des fonctions introduites est 
donné par les formules : 



par suite, si v est de la forme n -j- 1/2, avec 
n entier, les formules de récurrence mon- 
trent que J v est une combinaison linéaire 
de fonctions élémentaires. 

Représentation intégrale. Il est souvent 
commode de représenter J v sous la forme 
d’une intégrale. On a la formule : 


JvC*) = 


(xny 

r(v + 1/2) Vît 


J> 


-t 2 y- 


~ itx dt, 


qui est valable pour Re v + 1/2 >0. 
Fonction génératrice. Les fonctions de Bes- 
sel sont liées à un développement en série 
de Laurent. En effet, introduisons la fonc- 
tion : 


F (“) = e*P {hé)*’ 


H J {x) = Vü ' “p [ ■ ' ( • * — f - 1 )] + ^ w > 

H 5(*) = V^ exp [ - '( ;i_ T - ï)] + <p 4 (;t) ’ 

où les fonctions (p,{.v) tendent vers zéro 
lorsque .y tend vers l’infini avec 
| arg .y |< TT— e, e > 0 ; d’une manière plus 
précise, les quantités y 3/2 <p^.y) restent bor- 
nées. 

Formules de récurrence. À partir des déve- 
loppements en séries, on obtient les deux 
formules de récurrence : 


pour u complexe et y paramètre complexe 
non nul ; son développement en série de 
Laurent à l’origine s’écrit : 

+ °° 

(formule de Schlômilch). La fonction F (u) 
est appelée fonction génératrice. Chan- 
geant u en \ju et faisant le produit membre 
à membre des égalités obtenues, on 
obtient : 


L_i(x) + J v+ i(x) = 

J v _iW — = 2j;(x). 


l = [J 0 (*)F + 2^[J„(*)] 2 ; 
1 
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on en déduit, pour tout x réel, les majo- 
rations : 

|Jo(*)l<l. |J„(*)I<^ 5 ’ »>1. 

Voici une autre présentation de la 
formule de Schlomilch ; posant u — e îQ , on 
obtient : 

4- °° 

exp (ix sin 0) = ^ e inQ J„ (x ) ; 

les J„(x) sont donc ainsi les coefficients de 
Fourier de la fonction : 

0 exp (ix sin 0). 

Théorème de Neumann. À partir des fonc- 
tions de Bessel on peut obtenir des repré- 
sentations analogues au développement en 
séries entières. Plus précisément, toute 
fonction holomorphe dans le disque 
| z | < R peut être développée en série sous 
la forme : 

/(z) = y 

n = 0 

où la série converge absolument et unifor- 
mément dans tout disque compact 

|z|<Ri <R. 

De plus, il faut signaler que l’on peut 
faire une théorie analogue à la transfor- 
mation de Fourier en employant les fonc- 
tions de Bessel : soit f(x) une fonction 
définie pour x^ 0, à valeurs réelles ou 
complexes, continue par morceaux, telle 
que : 

j“x\fW\dx <~; 

pour tout entier n y positif, posons : 

<r„CO = J o V( t)h(st)dt- 


alors, on a la formule suivante d’inver- 
sion : 

/(*) = ^uJ n (xu)g n (u)du. 

Des fonctions voisines des fonctions de 
Bessel sont parfois utilisées. Ce sont, par 
exemple : 

I v (x) = exp ( — '-y- ) J v (/*), 

m * ) = Æ x 

appelées respectivement fonctions de Bes- 
sel modifiées, et fonctions de Bessel sphé- 
riques. 

PIERRE SAPHAR 
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BOOLE ALGÈBRE & ANNEAU DE 

L a notion d’algèbre de Boole, introduite 
par G. Boole (1847) et par A. De 
Morgan afin d’algébriser les opérations 
propositionnelles de la logique, joue un 
rôle très utile dans plusieurs branches 
des mathématiques (algèbre, théorie 
des ensembles ordonnés, calcul des pro- 
babilités) et en logique mathéma- 
tique (logique algébrique, modèles boo- 
léens). 
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On appelle algèbre de Boole (A, V, 
A , 1, 0, 1 ) la donnée d’un ensemble A 
(non vide) muni de deux lois de compo- 
sition interne V et A, associatives et 
commutatives, d’une application unaire 1 
et de deux éléments privilégiés 0 et 1, 
ces données vérifiant les axiomes sui- 
vants : 

Vx G A G A (x A y) V y = y ; 

Vx G A V y G A (x V y) A y — y ; 

VxGA VyGA VzEAx A (y V z) = (x A y) V (x A z) ; 
VxG A Vy G A VzGAx V (y A z) » (x Vy) A (x V z) ; 
VxG A x A Ix = 0; 
VxGAxVlx = l; 

VxGA0Vx=x; 

Vx G A 1 A x = x ; 

On appelle anneau de Boole la donnée 
(A ; 0, 1) d’un anneau commutatif 

unitaire vérifiant : 

VxG A x 2 = x. 

Les structures d’algèbre de Boole et 
d’anneau de Boole sont équivalentes au 
sens suivant : 

On peut associer à toute algèbre de 
Boole (A, V , A , 1, 0, 1) l’anneau de Boole 
(A ; 0, 1) défini par : 

VxG A VyG A x + y = (x A 1y) V (y A Ix), 
VxGA Vj'GA x .y — x A y ; 

— On peut associer à tout anneau de Boole 
(A ; 0, 1) l’algèbre de Boole (A, V , 

A, 1, 0, 1) définie par : 

VxGA VjjGA x V y = x + y + x .y, 
VxGA Vy G A x A y = x .y 
VxGA Ix = 1 + x. 

Les deux correspondances précédentes 
sont inverses l’une de l’autre, comme on le 
vérifie facilement, et permettent de ratta- 
cher la théorie des algèbres de Boole à la 
théorie des anneaux. On peut également 
rattacher la théorie des algèbres de Boole 
à celle des ensembles ordonnés en obser- 
vant que l’on peut définir un ordre cano- 


nique sur toute algèbre de Boole en 
posant : 

X < y <=>x \/ y = y. 

Exemples d'algèbre de Boole 

1. Pour tout ensemble X, l’ensemble 
îT(X) des parties de X devient une algèbre 
de Boole si on pose : 

VYCX VZ CX Y V Z — Y U Z, 
VYCX VZCXYAZ = YnZ, 
VYCX 1Y = X — Y, 

0 = 0, 1 = X. 

Il résulte d’un théorème fondamental, 
dû à M. Stone, que toute algèbre de Boole 
est isomorphe à une sous-algèbre de Boole 
d’une algèbre du type précédent. 

2. Soit l’ensemble des formules 
propositionneîles construites à l’aide des 
connecteurs V , A , 1 à partir d’un ensem- 
ble P non vide de variables proposition- 
neîles. Posons A - B si et seulement si la 
formule A ^ B est une tautologie. La 
relation ~ est une relation d’équivalence 
sur compatible avec les connecteurs V , 
A , 1, ce qui permet de définir sur une 
structure d’algèbre de Boole. Cette algèbre 
de Boole est appelée algèbre de Linden- 
baum du calcul propositionnel P et semble 
avoir été considérée implicitement par 
Boole. 

Les algèbres de Boole ont servi de 
prototype au développement de plusieurs 
techniques. Citons la logique algébrique : 
on adapte l’exemple 2 au contexte plus 
général de la logique du premier ordre, où 
l’on doit tenir compte de l’action des 
quantificateurs ; on obtient ainsi les struc- 
tures d’algèbres polyadique et cylindrique. 

La notion de spectre d'anneau 

Le théorème de Stone établit une dualité 
entre la catégorie des algèbres de Boole et 
celle des espaces topologiques compacts 


67 



CALCUL INFINITÉSIMAL 


totalement discontinus. Plus générale- 
ment, la notion de spectre d’anneau four- 
nit un foncteur très utile de la catégorie des 
anneaux commutatifs dans la catégorie des 
anneaux topologiques. 

Les algèbres de Boole sont d’un emploi 
constant et traditionnel en théorie de la 
mesure et en calcul des probabilités. On a 
introduit récemment avec succès la notion 
de modèle booléen, qui a permis de donner 
des démonstrations relativement simples 
de l’indépendance de l’hypothèse du 
continu et de faire faire des progrès à la 
théorie proprement dite des algèbres de 
Boole (construction d’algèbres de Boole 
sophistiquées n’ayant aucun automor- 
phisme non trivial, etc.). 

GABRIEL SABBAGH 
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CALCUL INFINITESIMAL 


A. Calcul à une variable 

Créée au xvn e siècle par Newton, Leibniz 
et leurs prédécesseurs immédiats, transfor- 
mée au xvm e , par Euler, en un prodigieux 
instrument de calcul, débarrassée, sous la 
Restauration, de sa métaphysique par le 
baron Cauchy, l’analyse infinitésimale a, 
depuis longtemps, atteint un degré de 
perfection tel qu’il est devenu possible d’en 
exposer l’essentiel en moins d’une dizaine 
de pages. C’est ce que nous allons essayer 
de faire, en renvoyant le lecteur à l’article 
qui précède pour des considérations his- 
toriques moins schématiques, et en nous 
plaçant ici au point de vue le plus « uni- 
dimensionnel » possible. Le lecteur qui 
désirerait un exposé plus philosophique et 
plus historique ne saurait mieux faire que 
de consulter l’ouvrage classique 
d’Otto Toeplitz. On n’a voulu, ici, exposer 
que les résultats les plus importants et les 
plus simples de la théorie classique à une 
variable, en s’efforçant de tout démontrer, 
et en ne demandant du lecteur que les 
connaissances les plus élémentaires sur les 
inégalités entre nombres décimaux, plus 
tout de même, cela va sans dire, une 
certaine habitude des raisonnements 
mathématiques. 

1 . Notion de borne supérieure 

Nous désignerons par R l’ensemble des 
nombres réels ; il nous suffira de savoir 
qu’un nombre réel est un développement 
décimal illimité précédé d’un signe (qu’on 
omet s’il s’agit du signe +), par exemple 
le nombre — 3,141 59. ... ou bien le nom- 
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bre 1 = 1,000 0 = 0,999 99. ..., et que 

Ton peut effectuer sur ces nombres des 
opérations algébriques que tout le monde 
connaît. On peut aussi comparer deux 
nombres réels a et y, autrement dit donner 
un sens à la relation a < y (qui exclut, 
notons-le, l’égalité x = >0- On peut, à 
partir de là, définir des intervalles de 
plusieurs natures ; par exemple, si a et b 
sont deux nombres réels donnés, on définit 
quatre intervalles dont a et b sont les 
extrémités, et qui ne diffèrent entre eux que 
dans la mesure où ils contiennent, ou non, 
leurs extrémités : l’intervalle [ a , b] est 
l’ensemble des nombres x tels que 
a < x < b , l’intervalle [a, b[ est formé des 
x tels que a < x < b, etc. Les intervalles 
de la forme [< a , b] sont dits compacts , et les 
intervalles de la forme }a, b[ sont dits 
ouverts. 

Considérons maintenant un ensemble E 
de nombres réels. On dit qu’il est borné 
supérieurement s’il existe un nombre réel 
M tel que l’on ait x < M pour tout .y E E 
(rappelons que cette notation signifie que 
le nombre .y appartient à E, ou est un 
élément de E), et borné inférieurement s’il 
existe un nombre m tel que l’on ait m ^ x 
pour tout x E E. Si E est borné supérieu- 
rement et inférieurement (c’est-à-dire s’il 
existe un intervalle qui contient E), on dit 
que E est borné tout court. Par exemple, 
l’ensemble N des entiers naturels (ses 
éléments sont 0, 1,2, ...) est borné infé- 
rieurement, mais non supérieurement, tan- 
dis que l’ensemble des nombres rationnels 
.y tels que .y 3 < 2 est borné supérieurement 
(en effet .v 3 < 2 implique a* 3 < 8 = 2 3 , 
d’où .y < 2, comme on le voit facilement). 

Soit E un ensemble borné supérieure- 
ment, et soit M un nombre tel que x ^ M 
pour tout x E E. S’il existe un nombre 
M' < M tel que l’on ait aussi .y < M' pour 
tout x E E, on obtient des informations 


plus précises sur les éléments de E en 
écrivant qu’ils sont tous inférieurs à M', 
qu’en écrivant qu’ils sont tous inférieurs à 
M (exemple concret : savoir que tout 
homme vit au plus 500 ans est mieux que 
rien, mais il vaut mieux savoir que tout le 
monde meurt avant 200 ans). Pour obte- 
nir, de ce point de vue, les informations les 
plus précises possibles sur E, on est donc 
amené à choisir le nombre M aussi petit 
que possible, d’où la définition suivante : 
on dit que M est la borne supérieure de E 
si x ^ M pour tout x E E, et si, de plus, il 
n’existe aucun nombre M' < M possédant 
la première propriété, ou encore si, pour 
tout M' < M, il y a au moins un x E E tel 
que M' < x < M. Par exemple, la borne 
supérieure de l’intervalle [0, 1[ est le nom- 
bre 1 : on a a < 1 dès que 0 ^ a < 1 , et, 
pour tout M' < 1 , il y a des nombres a* tels 
que l’on ait à la fois 0 < a < 1 et M' < a. 
On désigne par sup(E) la borne supérieure 
d’un ensemble E de nombres réels, et par 
inf(E) sa borne inférieure, définie de façon 
analogue en renversant les inégalités. 

Théorème i. Tout ensemble non vide 
borné supérieurement de nombres réels 
possède une borne supérieure. 

La démonstration très simple de ce 
théorème d’existence (il ne suffit pas de 
parler d’un objet possédant des propriétés 
données pour que l’objet en question 
existe) procède comme suit. Supposons, 
pour fixer les idées, que l’ensemble E 
considéré soit contenu dans l’intervalle 
[0, 1[ ; on notera 0, a 1 a 2 a v .. le développe- 
ment décimal illimité de tout x E E. de 
sorte que les chiffres x k sont des entiers 
compris entre 0 et 9. Nous allons cons- 
truire les décimales successives a u a 2 , ... de 
la borne supérieure cherchée a. On prend 
pour a j la plus grande valeur prise par la 
décimale a, de a lorsque a décrit E 
(autrement dit : on a a, < a x pour tout 
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x E E, et il existe un iGE tel que 
jc 1 =ûj); soit alors E! l’ensemble des 
.y E E tels que x { = a x ; on prend pour a 2 
la plus grande valeur prise par la décimale 
jy 2 lorsque x décrit Ej ; soit alors E 2 
l’ensemble des xEE, tels que x 2 = a 2 
(c’est-à-dire des x E E dont les deux pre- 
mières décimales sont a l et a 2 ) ; on prend 
pour a } la plus grande valeur prise par x 3 
lorsque x décrit E 2 , et ainsi de suite 
indéfiniment. Considérons alors le nombre 
a = 0, a x a 2 a 3 ... ainsi construit. On a la 
relation x < a pour tout .y E E, car si l’on 

a .y, = a, Xp — a p (c’est-à-dire si x 

appartient à l’ensemble E^ construit plus 
haut), on a x p+x ^ a p+] par définition 
même de a p+l ; on aboutit bien ainsi à la 
règle classique pour comparer deux déve- 
loppements décimaux. De plus, pour tout 
entier p, il y a effectivement des x E E tels 
que l’on ait Xj = a h ..., x p = a p , et donc 
a — 10"' < x < a ; comme il existe, pour 
tout M' < a , un entier p tel que M' < a — 
1 0 _/ \ il existe donc a fortiori un x E E tel 
que M' < x. 

Le théorème 1 et des énoncés analogues 
expriment toute la « métaphysique » du 
calcul infinitésimal, à savoir l’existence 
d’un nombre réel possédant un dévelop- 
pement décimal arbitrairement donné. 
Toutes ces constructions s’écrouleraient si 
l’on ne connaissait que les nombres ration- 
nels, car la borne supérieure d’un ensemble 
de nombres rationnels (par exemple de 
l’ensemble des x rationnels tels que x 2 < 2) 
peut fort bien être irrationnelle (dans 
l’exemple considéré, c’est le nombre VT). 

Pour les applications à la théorie de 
l’intégration, nous aurons besoin d’un 
autre résultat, plus élémentaire. 

Théorème 2. Soit A et B deux ensembles 
non vides de nombres réels, et supposons 
x < y pour tout x E A et tout y E B. Alors 
A est borné supérieurement, B borné 


inférieurement, et l’on a sup(A) < inf(B). 
Pour que sup( A) = inf(B), il faut et il suffit 
que, pour tout entier />, il existe un x E A 
et un y E B tels que l’on ait y — x < 10 -/ \ 

Comme B est non vide, il existe des 
nombres qui appartiennent à B, et qui par 
suite majorent tout x E A : par suite A est 
borné supérieurement. A n’étant pas vide, 
le même raisonnement montre que B est 
borné inférieurement. Si y E B, on ax < y 
pour tout x E A, et donc sup(A) ^ y , 
puisque, par définition, sup A est le plus 
petit nombre qui dépasse tous les x E A. 
Mais, comme sup(A) est inférieur à tous 
les y E B, on en conclut, par un argument 
analogue, que sup(A) < inf(B). Pour tout 
entier p il y a un x E A et un y E B tels que 
l’on ait : 

sup (A) — H) - : 1 < x < sup (A) < inf(B) 

< y < inf(B) + 10 ~p~\ 

d’où : 

y — x < inf(B) — sup (A) + 2.10 _ ^ —1 

< inf(B) — sup (A) 4- 10— 

et par suite y — x < 10 /7 si 
inf(B) = sup(A). Inversement, si l’on 
peut, pour tout /?, trouver un x E A et un 
>’EB tels que y — x ^ 10 A alors le fait 
que l’on ax ^ sup(A) ^ inf (B) < y mon- 
tre que inf(B) — sup(A) < 1 0"* ; cela étant 
vrai pour tout p , il s’ensuit que 
sup(A) = inf(B). 

La notion de borne supérieure d’un 
ensemble de nombres réels permet de 
définir celle de borne supérieure (ou de 
« maximum ») dune fonction à valeurs 
réelles. Soit X un ensemble (par exemple 
un intervalle dans l’ensemble des nombres 
réels) et / une fonction définie sur X et à 
valeurs réelles : / associe donc à chaque 
x E X un nombre réel f (x) qui, en général, 
dépend de x. Notons /(X) l’ensemble des 
nombres réels y tels qu’il existe un xE X 
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tel que y — f (x) (« image » de X par /), 
autrement dit l’ensemble des « valeurs » 
prises par la fonction /(x) lorsque x 
« décrit » X. On dit que / est bornée 
supérieurement (resp. inférieurement) sur 
X si l'ensemble / (X) est borné supérieu- 
rement (resp. inférieurement), c’est-à-dire 
s’il existe un nombre réel a tel que l’on ait 
/(x) < a (resp. /(x) ^ a) pour tout 
x E X. Le nombre sup(/(X)) [resp. 
inf(/(X))] s’appelle alors la borne supé- 
rieure (resp. inférieure) ou le maximum 
(resp. minimum) de la fonction / sur X, et 
on le désigne par l’assemblage de lettres et 
de signes que voici : 

sup / (je) (resp. inf f (*)). 

*ex *ex 

On peut donc caractériser le nombre 
M = sup f (x) par les deux propriétés 

A-ex 

suivantes : 

(a) on a / (*) ^ M pour tout x E X ; 

(b) pour tout entier p, il existe un x E X tel 
que M — 10 -/? < /(x) < M. 

On fera attention au fait qu’il n’existe 
pas toujours un x E X où l’on a exactement 
f (x) = M, comme le montre le contre- 
exemple suivant : on prend pour X l’inter- 
valle [0, 1[, ensemble des x réels tels que 
0 < x < 1 , et pour /la fonction / (x) — x, 
dont le graphe est un segment de droite, 
comme chacun le sait ; on a ici M = 1 , 
mais / (x) < 1 pour tout .v E X. 

L’existence d’un nombre réel dont on se 
donne d’avance des approximations à 10 _/; 
près pour tout p peut encore se traduire 
par le résultat suivant (qui nous sera utile 
plus loin), habituellement connu sous le 
nom de « critère de Cauchy », bien que les 
énoncés qu’on en donne classiquement 
diffèrent légèrement de celui que l’on 
trouvera ci-dessous : 

Théorème 3. Soit Xj,x 2 , une suite 
illimitée de nombres réels. Supposons que, 


pour tout entier /?, il existe un entier q tel 
que l’on ait | x m — x n \ < 1 0 ~ p dès que m et 
n dépassent q. Alors il existe un nombre 
réel a tel que, pour tout p , on ait : 

\x„ — a | < 10“* pour tout n > q. 

Nous supposerons (on s’y ramènerait 
facilement) que tous les nombres x, sont 
compris entre 0 et 1 . Écrivons le dévelop- 
pement décimal de x, sous la forme : 

Xi = 

en désignant par x f - la /:-ième décimale de 
x h comprise entre 0 et 9. Comme on a : 

|x m — x n | < 10 “ p pour m ^ q et n > q, 

il est clair (tout au moins si l’on néglige les 
difficultés accessoires dues aux développe- 
ments décimaux impropres) que l’on peut 
supposer que les /? — 1 premières décima- 
les de x m et x„ sont les mêmes dès que m 
et n dépassent q , autrement dit qu’à partir 
du rang n — q les p — 1 premières déci- 
males de x„ restent fixes. Faisant succes- 
sivement p = 2 , 3 , ..., on voit donc qu’à 
partir de l’entier q 2 correspondant à p — 2 
la première décimale x wl de x„ aura une 
valeur fixe a u puisqu’à partir de l’entier q 2 
correspondant à p = 3 la seconde déci- 
male x, fi aura en outre une valeur fixe a 2 , 
et ainsi de suite indéfiniment. Considérons 
alors le nombre réel a = 0 , ..., dont 

on vient de construire les décimales de 
proche en proche ; choisissons un entier p 
quelconque et considérons l’entier q qui lui 
correspond d’après l’énoncé du théorème ; 
pour tout n > q , les p — 1 décimales de x„ 
sont égales à celles de a , par construction 
même de a. On a donc : 

\x n — a | ^ 10~* + 1 pour tout n ^ q ; 

il reste à montrer qu’on peut en fait, au 
second membre, remplacer 10 /,+ 1 par 
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I0 /; . Pour cela choisissons un entier r 
quelconque ; d’après ce que Ton vient de 
voir, on a | x m — a \ < 1 0 _/ ' pour tout m 
suffisamment grand (remplacer p par 
r + 1 dans ce qui précède) ; mais si Ton 
suppose m et n supérieurs k q on a aussi, 
par hypothèse, | x m — y„ | < 10“*; combi- 
nant ces deux inégalités, on en conclut que 
Ton a : 

\x n — a | ^ 10“ p + 10“ r pour tout n > q 

et pour tout entier r. Cela étant valable 
pour tout r entraîne évidemment l’inégalité 
cherchée | x n — a | < 1 0 *, d’où le théo- 
rème. 

On énonce habituellement le théorème 
3 en termes de suites convergentes et de 
limites, mais nous ferons en sorte, ici, 
d’éviter l’usage de ces notions - ce qui est 
parfaitement possible - afin de faciliter la 
tâche du lecteur. 


2. Intégrale d'une fonction étagée 

Considérons, sur un intervalle compact 
X = [a, b ], une fonction / (.y) à valeurs 
réelles ; nous la supposerons même, pour 
le moment, à valeurs positives. Si Ton 
trace le graphe de /, on obtient dans le plan 
une « courbe », l’ensemble des points 
(.y, y) tels que l’on ait .y E X et y — /(.y), 
qui délimite avec l’axe des abscisses et les 
verticales des points a et b une portion de 
plan dont on se propose de calculer la 
surface (dans l’hypothèse où la portion en 
question serait assez simple pour que l’on 
puisse attribuer une signification à ce 
calcul). 

Les surfaces les plus simples à calculer 
sont celles des rectangles. On est ainsi 
amené à envisager d’abord un cas parti- 
culier, celui où l’on peut découper l’inter- 
valle donné X en intervalles partiels 


Xj, ...,X p tels que la fonction / (.y) prenne, 
dans chaque X*, une valeur constante a k ; 
noter que nous n’excluons aucunement le 
cas où certains X k se réduiraient à un 
point, et que nous n’imposons pas aux X k 
d’être compacts — certains X k peuvent 
contenir leurs extrémités, d’autres ne pas 
les contenir. Le graphe de la fonction / se 
compose alors de segments de droite 
horizontaux, et on dit que / est une 
fonction étagée. La portion de plan com- 
prise entre le graphe et l’axe des y est alors 
(fig. 1) réunion de p rectangles ayant pour 



bases les intervalles X k , et pour hauteurs 
les valeurs a k correspondantes. Supposant, 
ce qui est permis, les intervalles X k deux à 
deux disjoints (c’est-à-dire sans points com- 
muns), nous appellerons alors, par défini- 
tion, intégrale de / sur l’intervalle X le 
nombre : 

(1) !(/) = a J(X { ) -f ... + a p l(X p ), 

où /(X) désigne, d’une manière générale, la 
longueur d’un intervalle X. Le nombre 
!(/) ainsi obtenu dépend naturellement de 
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la fonction/ considérée, mais non du décou- 
page de l’intervalle X en intervalles partiels 
X k sur lesquels/ est constante ; si, en effet, 
l’on découpe, d’une autre façon, X en inter- 
valles deux à deux disjoints Yj, ..., Y q sur 
lesquels/prend les valeurs b u ... b q , de sorte 
que nous devons prouver que : 

( 2 ) aJ(X,) + ... + a p !(X p ) 

= b x l{ Yj) + ... + b q l{ Y q ), 

il est clair que chaque X k est réunion de ses 
intersections X* Pi Y h avec les divers Y h ; 
ces intersections sont des intervalles deux 
à deux disjoints ; on a donc : 

/(x*) = /(x*nYi) + ... + /(x*nY,) f 

d’où il résulte aussitôt que le premier 
membre de (2) est la somme de tous les 
nombres de la forme a k l(X k DY h ), le 
second étant, de même, somme de tous les 
nombres b h l(X k D Y,,). Il suffit donc de 
montrer que l’on a a k l(X k C\Y h ) == 
b h l(X k Pi Y /f ) quels que soient k et h. Or la 
fonction / est égale, sur l’intersection 
X* Pi Y/,, à la fois à a k et à b h ; si l’inter- 
section n’est pas vide, on a donc a k = b h 
et le résultat s’ensuit ; si l’intersection est 
vide, on a l(X k C)Y h ) — 0, et le résultat 
cherché s’écrit 0 = 0; d’où la relation (2). 

Nous utiliserons encore la relation (1) 
pour définir I (/) lorsque la fonction / n’est 
plus positive. 

Les intégrales des fonctions étagées 
possèdent des propriétés simples dont 
nous aurons besoin plus loin. Tout 
d’abord, si / et g sont deux fonctions 
étagées sur le même intervalle compact X, 
alors la fonction h—f-\-g donnée par 
h(x) = / (x) + g(x) pour tout x E X est 
encore étagée, et l’on a la relation : 

( 3 ) l(/ + *) = I(/) + I(*). 

En effet, si l’on partage X en intervalles 
X, deux à deux disjoints, sur lesquels / 


prend des valeurs constantes 
a,(\ < / < p ), et en intervalles deux à 
deux disjoints Y j9 sur lesquels g prend des 
valeurs constantes bj{ 1 < q ), il est 

clair que X est réunion des pq intervalles 
X,- P) Y j, que / + g prend sur X t H Y ; la 
valeur constante a f -f bj (d’où le fait que 
f ~\~ g soit étagée), et enfin que I (/+ g) 
est la somme de toutes les expressions 
(a i + bj) l (Xy Pi Yj), c’est-à-dire des 
expressions a J (X,- H Y/, dont la somme 
est égale à I (/) comme on l’a vu plus haut, 
et des expressions bj l (X,- Pi Y/, dont la 
somme est égale à I (g) pour des raisons 
analogues ; d’où la relation (3). 

On déduit évidemment de cette relation 

(3) que l(f-g) — l(f) — l(g) ; et il est 
évident que : 

(4) l(cf) = c.I(f) 

pour toute constante c, en convenant de 
définir la fonction étagée cf = g par la 
condition que g (x) — c . / ( x ) pour tout x. 

Enfin, si/est une fonction étagée (donc 
bornée) sur un intervalle compact X, on a 
l’inégalité : 

(5) |I(/)|</(X).sup|/(*)|, 

*ex 

où nous utilisons (pour la fonction 
étagée | f(x) \ ) la notion de borne supé- 
rieure définie à la fin du chapitre précé- 
dent. En effet, l’inégalité classique 
\a b \ ^ | a | + | H appliquée à la défi- 
nition (1) ci-dessus, montre que l’on a : 

|I(/)| < + ... + \a f \l(X p ); 

mais, si l’on pose M = sup | / (.v) |, il est 
clair que M est le plus grand des p nombres 
| a, |, | a p |, d’où : 

!I(/)|<M./(X,) + ... + M./(X„) 

= M [/ (X,) + ... + /(X,)] = M./(X), 

puisque les intervalles X,- sont deux à deux 
disjoints, et remplissent X tout entier. 
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3. Intégration des fonctions réglées 

Considérons maintenant le cas général ; 
nous ne supposons plus que la fonction / 
soit étagée, mais nous supposerons, pour 
éviter des difficultés secondaires, qu’elle 
est bornée , c’est-à-dire qu’il existe un nom- 
bre M tel que l’on ait — M ^ / (x) ^ M 
pour tout x G X ; pour le moment, suppo- 
sons aussi/ (x) > 0 pour tout x. Soit cp' et 
cp" des fonctions étagées telles que l’on ait 
0 < cp'(x) ^ /(x) < cp" (x) pour tout x (il 
en existe : prendre cp'(x) = 0 partout, et 
cp"(x) = M partout, par exemple). L’aire 
limitée par l’axe des x et le graphe de / 
contient l’aire analogue relative à cp', et est 
contenue dans l’aire analogue relative à 
cp" ; si l’on peut attribuer un sens raison- 
nable à l’intégrale I(/) de la fonction/, on 
doit donc avoir la relation : 

(6) I(f)<I(/)<I(f). 

On est alors conduit, que f soit ou non 
positive , à introduire deux ensembles E* et 
E* de nombres réels : le premier sera formé 
des x tels qu’il existe une fonction étagée 
cp' sur X telle que l’on ait x = I(cp') et 
cp' </ (c’est-à-dire cp'(/) < f(t) pour tout 
t E X) ; le second sera l’ensemble des 
nombres réels x pour lesquels on peut 
trouver sur X une fonction étagée cp" 
vérifiant les relations/ < cp", etx = I(cp"). 
La relation (6) exprime que le nombre I(/) 
cherché est supérieur à tout x GE*, et 
inférieur à tout x G E*. Or l’ensemble E* 
est borné inférieurement et E* l’est supé- 
rieurement (les éléments de E* sont évi- 
demment inférieurs à ceux de E*, puisque 
la relation cp' < cp", pour des fonctions 
étagées, implique visiblement l’inégalité 
I(cp') < I(cp") entre leurs intégrales). Si 
nous désignons par m la borne supérieure 
de l’ensemble E*, et par M la borne 
inférieure de l’ensemble E*, la relation (6) 


exprime que l’intégrale cherchée de /doit 
être comprise entre m et M ; noter que, 
comme tout élément de E* est inférieur à 
tout élément de E* comme on vient de le 
voir, on a aussi m < M ; pour que la 
relation m < I (/) < M suffise à détermi- 
ner le nombre I(/) cherché, il suffit donc 
de supposer que l’on a m = M. En vertu 
du théorème 2, les constructions qui pré- 
cèdent déterminent donc sans ambiguïté 
I (/) si la 'condition suivante est remplie : 
pour tout entier p , il existe sur X des 
fonctions étagées cp' et cp" telles que l’on ait 
d’une part 0 < cp' (x) </(x) < cp"(x) 
pour tout xGX, et d’autre part I(cp")~ 
I(cp') < 10 -/ \ S’il en est ainsi on dit que 
la fonction / est intégrable (au sens 
de Riemann) sur l’intervalle X, et l’on 
pose : 

J7«<k = !(/)• 

Il est sans doute prudent de déconseiller 
au lecteur toute tentative d’interprétation 
mathématique de l’assemblage de signes et 
de lettres figurant au premier membre, et 
qu’on ne peut expliquer qu’en faisant appel 
à la psychologie de Leibniz, sujet intéres- 
sant, mais qui nous entraînerait trop loin, 
probablement jusqu’aux philosophes 
grecs, trop curieux, qui se demandaient 
comment une étendue finie pourrait bien 
être obtenue en juxtaposant une infinité 
d’étendues infinitésimales. La réponse du 
mathématicien à ce genre de questions est 
de prier l’interlocuteur de bien vouloir lui 
fournir, au préalable, une définition mathé- 
matique des termes qu’il emploie, attendu 
que c’est la règle de base de toute discus- 
sion mathématique sérieuse (on trouve 
même des gens pour prétendre que le 
respect de cette convention n’est pas sans 
présenter quelque utilité en dehors des 
mathématiques) ; et c’est très exactement 
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parce que personne, en vingt siècles, n’a 
été capable de lui fournir des définitions 
précises de ces termes que le mathémati- 
cien, en tant que tel, les rejette vers les 
ténèbres dialectiques de la métaphysique, 
de la psychologie et de l’histoire humaines, 
sans chercher à « comprendre » au sens 
des philosophes. À la limite, la seule chose 
qui intéresse le mathématicien, en tant que 
tel, est d’être en mesure de calculer des 
intégrales, voire, diraient beaucoup de 
gens, d’édifier des procédures mécanisées 
qui, introduites à l’entrée d’une calculatrice 
électronique, fourniront automatiquement 
le résultat cherché avec une marge d’erreur 
calculable. La définition des intégrales que 
nous venons d’exposer est éminemment 
adaptée à ce point de vue « opérationnel » 

— il suffit de substituer, au calcul de I (/), 
celui de l’intégrale 1 ( 9 ) d’une fonction 
étagée cp « suffisamment voisine » de f 

— comme aussi, bien entendu, au point de 
vue « absolu » du mathématicien pur, qui 
désire poursuivre indéfiniment la construc- 
tion du nombre !(/) par approximations 
de plus en plus étroites. C’est probable- 
ment dans ce désir de précision absolue que 
se sont réfugiées les conceptions métaphy- 
siques des Anciens et des classiques, 
puisqu'on n’imagine pas une machine cal- 
culant éternellement... 

Indépendamment des problèmes de 
calcul pratique, qui n’intéressent pas le 
mathématicien, la notion d’intégrale serait 
inutilisable si l’on ne connaissait pas 
« beaucoup » de fonctions intégrables, et si 
l’on ne disposait pas de procédés mathé- 
matiques pour calculer (absolument, c’est- 
à-dire sans marge d’erreur) les intégrales 
de beaucoup de fonctions. Nous allons 
définir ici une catégorie de fonctions inté- 
grables qui, en pratique, permet de couvrir 
tous les besoins de l’analyse classique. 


Pour qu’une fonction / définie et 
bornée sur un intervalle compact X soit 
intégrable sur X, il faut et il suffit, comme 
on l’a vu plus haut, que l’on puisse trouver, 
pour tout entier p > 0, des fonctions 
étagées cp' et cp" sur X vérifiant les 
relations : 

(7) 9' </< cp", l(tp") — I(cp') < ÎO - *. 

La seconde de ces relations s’écrit 
encore I(cp" — cp') < 10 p . Or on a, 
d’après la relation (5) appliquée à la 
fonction étagée positive cp"— cp', l’inéga- 
lité : 

1(9 " — cp')</(X). sup[<p"(x) — <p '(*)]. 

xEX 

en sorte que, pour réaliser la seconde 
condition (7) ci-dessus, il suffit de choisir 
les fonctions étagées cp' et cp" de telle sorte 
que l’on ait : 

/(X). sup [cp " (jc) — cp '(*)] < 10 “ p ; 

xEX 

si l’on choisit un entier q tel que /(X). 10 <l 
< 10 _/; , on est évidemment ramené à 
construire des fonctions étagées cp' et cp" 
vérifiant les conditions suivantes : 

(8) cp' </< cp", <p"(x) — <p'(x) ^ 10-* 
pour tout x E X. 

S’il est possible, quel que soit q , de 
trouver deux telles fonctions cp' et cp", on 
dit que la fonction /est réglée sur l’inter- 
valle X. Il est bien clair que ces considé- 
rations n’ont d’autre but que d’assurer le 
résultat (sic) suivant : 

Théorème 4. Soit X un intervalle com- 
pact. Toute fonction réglée sur X est 
intégrable sur X. 

Il est à peu près évident que, si / 
et g sont deux fonctions réglées sur X, 
il en est de même de leur somme f - f- g, 
de leur différence /—g, et de leur 
produit fg = h , défini par la relation 
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h(x) — / (x)g(.v). On a de plus les rela- de la moyenne ». En pratique, il est encore 
tions : plus utile d’utiliser l’inégalité : 


(9) I(/ + *) = I(/) + Ife), I(c/) = c.I(/) 

(où c désigne une constante), qui résultent 
immédiatement des relations analogues (3) 
et (4) pour les fonctions étagées. Établis- 
sons par exemple la première. Pour chaque 
entier p, on peut par hypothèse trouver des 
fonctions étagées cp', cp", ip\ tp" vérifiant 
les conditions suivantes : 


<p' </< 9 ", 1(9") — 1(9') < 10-/’-*, 

9' < g < 9", 1(9") — 1(9') < ÎO-^- 1 , 

d’où résulte que I(/) est égal à I(cp') à 
10 /;_l près, et que I(g) est égal à I(ip') à 
10 _;î_l près aussi. Mais les fonctions éta- 
gées 0' — cp' + ip' et 0" = cp" + tp" véri- 
fient évidemment les relations suivantes : 


0' </ + £ < 0", 1(0") — 1(9') < 2.10 -P~ l , 
la seconde résultant du fait que l’on a : 
1(0") -1(0') 

= [I (cp ") + I (9 ")] — [1(9) “F I (9 ')] 

= [1(9")— 1(9')] + [1(9 0-1(9')] < 2 .\ 0 ~ P~K 

Par suite, I(/+g) est égal à 2.10 p 1 
près à 1(0') = I(cp') + I(ip'), lui-même égal 
à 2.10 p 1 près à I(/) + I(g), de sorte 
que l(f+ g) et I (/) + %) sont égaux 
à 4.10"/ 7- ' 1 près, à plus forte raison à 10' p 
près, et cela pour tout p : d’où la première 
relation (9). 

À partir de la relation (5) établie pour 
les fonctions étagées on démontrerait, par 
des raisonnements analogues, que celle-ci 
est valable plus généralement pour les 
fonctions réglées. On l’exprime encore, en 
utilisant la notation de Leibniz, en écrivant 
que l’on a : 


( 10 ) 


J7(*)<** 


M (b ~a) 


si |/(v) | ^ M pour tout x G [a, b], résultat 
connu sous le nom de « premier théorème 


(11) I fV(*)<&U \ b \f(x)\dx, 

(la va 

qui s’obtient immédiatement sur la for- 
mule (1) lorsqu’il s’agit de fonctions éta- 
gées, et qu’on étend ensuite facilement aux 
fonctions réglées par des arguments 
d’approximation analogues à ceux qu’on a 
déjà exposé plus haut. 


4. Caractérisations des fonctions 

réglées 

Soit / une fonction à valeurs réelles définie 
sur un intervalle X, et Y un intervalle (ou 
un ensemble) contenu dans X. Nous 
dirons que / est constante à 10 /? près sur Y 
s’il existe un nombre c tel que l’on ait 
\f(x) — c | < 10 ~ p pour tout .v G Y. 

Théorème 5. Soit /une fonction définie 
sur un intervalle compact X. Pour que / 
soit réglée dans X il faut et il suffit que pour 
tout entier p , on puisse partager l’intervalle 
X en un nombre fini d’intervalles partiels 
X h ..., X n tels que / soit constante à 10 p 
près dans chaque X,. 

C’est presque la définition. Si en effet 
on peut trouver, pour chaque X,-, une 
constante c } telle que |/(.v) — cy | / 10 p 
pour tout .v G X/, on peut immédiate- 
ment construire deux fonctions étagées 
cp' et cp" vérifiant cp' ^/^ cp" et 
cp" (.v) — cp' (.y) ^ 2. 1 0 p pour tout x G X, 
à savoir les fonctions qui dans chaque X,, 
sont respectivement égales à c, — 1 0“ /; 
et à cv+lO G Inversement, si / est 
réglée, il est possible de réaliser les 
conditions (8) ci-dessus, puis de partager 
X en intervalles sur chacun desquels cp' et 
cp" sont constantes, et sur chacun desquels 
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/ est, par suite, constante à 10 près 
(fig- 2). 



Dans la pratique, on a besoin de carac- 
tériser les fonctions réglées par un critère 
exprimant que leur comportement « au 
voisinage de chaque valeur de la variable » 
est assez simple pour que/ (a) n’oscille pas 
d’une manière incontrôlable lorsque .v se 
rapproche de plus en plus d’une « limite » 
donnée. Cela va nous obliger à développer 
quelques considérations sur les valeurs 
limites d’une fonction. 

Soit / une fonction réglée sur un inter- 
valle X, et soit a un point de X ; considé- 
rons les valeurs de /aux points .vE X tels 
que a < .v (ce qui suppose a distinct de 
l’extrémité droite de X) ; nous allons mon- 
trer que lorsque a* se « rapproche de plus 
en plus » de a , le nombre /(.v) « se 
rapproche de plus en plus » lui aussi d’une 
certaine valeur h bien définie, que l’on 
appellera la valeur limite à droite de f au 
point a. Noter que cette propriété est 
évidente si / est une fonction étagée ; il y 
a en effet alors un a' > a tel que /(a) soit 
constant dans l’intervalle a < x < a ' (car 


si l’on décompose X en intervalles partiels 
sur chacun desquels / est constante, le 
point a est soit intérieur à l’un de ces 
intervalles, soit l’extrémité gauche de l’un 
d’entre eux) ; il est alors clair que si a* > a 
se rapproche de a,f (a), qui ne bouge pas, 
se rapproche de plus en plus d’une valeur 
limite (à savoir de sa valeur, constante, 
dans l’intervalle a < x < a’). 

Dans le cas général, nous savons qu’il 
existe, pour chaque entier /?, une partition 
de X en intervalles partiels sur chacun 
desquels f (x) est constant à 1 0 7 ’ près. 
Pour chaque entier /?, il y a donc dans X 
un point a P> a tel que //y) soit constant 
à 10 /? 2 près dans l’intervalle a < x < a }r 
d’où un nombre réel b p tel que : 

(12) a < x < a p ^\f{x) — b p \ ^ 10-p- 2 ; 

on peut évidemment supposer, si on le 
désire, que rq ^ a 2 > a 3 ^ en rempla- 
çant au besoin a p par a p _ { pour chaque p 
tel que O, > «P 1 ■ Cela dit, choisissons un 
entier p et considérons les nombres b p , 
b p+u b p+ 2 , ... ; si m et n sont deux entiers 
supérieurs à p, tels par exemple que 
p < m < /?, considérons un a tel que 
a < x < a n ; on aura aussi les inégalités 

a < a < a nr d’où, à la fois : 

\f(x) — b m \^ 10— - 2 < 10 -'- 2 , 

| / (x) — b n | < 10-"- - 2 < 10-^- 2 , 

ce qui montre évidemment que l’on a : 

( 13 ) | b m — b n \ ^ 2 . 10 < 10 — 

dès que m et n dépassent p. D’après le 
critère de Cauchy (théorème 3), il existe 
donc un nombre réel b tel que l’on ait 

| b — b n | < 10 p ] pour tout n > et en 

particulier pour n = p. Si a < x < a jr on 
a alors à la fois |/(a) — b p \ < 10 _/ ' 2 et 
\ b p — b \ < 10^-*, d’où évidemment 
|/(a") b | < 10 C 
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Cela nous conduit à la notion de 
limite à droite : on dit qu’une fonction 
f{x) définie sur un intervalle X possède 
en un point a de X une valeur limite à 
droite s’il existe un nombre b possédant 
la propriété que, pour tout /?, il existe dans 
X un nombre a p > a tel que l’on ait 
\f{x)-b\ ^ 10 p pour tout x tel que 
a < x < a p (faire attention au fait que l’on 
n’impose aucune condition pour x = a). 
Cela signifie encore que, pour tout p , il y 
a un intervalle a < x < a p d’origine a 
dans lequel f(x) est égal à b à 10 -/; près. 
S’il existe un tel nombre b 9 il est unique 
(car si b' satisfait aux mêmes conditions, 
il existe, pour tout p , des x > a où 
l’on a à la fois \f(x) — £| < 10~ /J_1 et 
|/Cy) — b’ | < 1 0 - * -1 , d’où | b 1 — b \ ^ 1 0 p 
pour tout p, et finalement b ' = b). Ce 
nombre b s’appelle, par définition, la 
valeur limite à droite de/ au point a, et se 
désigne soit par la notation f ( {a), soit par 
la notation f(a + 0), artifice amusant 
pour rappeler que l’on considère la limite 
de l’expression fia + h) lorsque h tend 
vers 0 en restant strictement positif. Bien 
entendu, il ne faut pas, dans la notation 
précédente, remplacer a -\- 0 par a 
(l’assemblage a + 0 ne désigne pas, ici, 
la somme de deux nombres ; il ne constitue 
qu’un graphisme dépourvu de tout 
autre sens que celui que nous lui avons 
attribué conventionnellement). En fait, il 
peut fort bien arriver que l’on ait 
f(a + 0) =£f(a), comme le montre 
l’exemple fort simple de la fonction f(x) 
définie quel que soit x réel par les formules 
suivantes : 


04 ) /(*> = 


x si x > 1, 

0 si x = 1, 

x — 4 si x < 1. 


On a ici /(I + 0) = 1 
/(D = 0*= I. 


et 


On définirait, bien entendu, de même la 
notion de valeur limite à gauche de / au 
point u, notée / (a) ou f (a ~ 0) : c’est un 
nombre b (forcément unique s’il existe) tel 
que, pour tout /?, il existe dans X un a p < a 
tel que la relation a p < x < a implique 
|/(a') — 6| < 10 -/7 (le nombre que nous 
désignons ici par a p n’a, bien entendu, 
aucun rapport avec celui que nous avons 
noté de la même façon plus haut). Au point 
où nous en sommes, nous avons évidem- 
ment démontré une moitié de l’énoncé 
fondamental que voici : 

Théorème 6. Pour qu’une fonction f 
définie sur un intervalle compact X soit 
réglée sur X, il faut et il suffit qu’elle 
admette en tout point de X des valeurs 
limites à droite et à gauche. 

Il nous reste maintenant à montrer 
qu’inversement une fonction / qui admet, 
en chaque point a de X, des valeurs limites 
à droite et à gauche, est nécessairement 
réglée sur X. Choisissons pour cela un 
entier p ; nous devons prouver l’existence 
d’un nombre fini d’intervalles X 1? ..., 
X w possédant les propriétés suivantes : X 
est la réunion de X u ..., X„, et la fonction 
f(x) est constante à 10'* près sur chacun 
des X r 

Mais l’existence de valeurs limites 
montre que, pour chaque a G X, il existe 
dans X des nombres a et a" tels que l’on 
ait a’ < a < a” et tels que la fonction / 
soit constante à 10~* près dans chacun 
des deux intervalles a < x < a et 
a < x < a” (si a est l’extrémité gauche 
de X, on considère seulement u", et 
seulement a si a est l’extrémité droite de 
X). Désignons alors par I (a) l’intervalle 
a' < x < a” , dans le cas où a n’est pas 
une extrémité de X, et définissons I (a) de 
la façon suivante, lorsque a est une 
extrémité de X : si a est l’extrémité gauche 
de X, on choisit arbitrairement un a' < a 
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(donc en dehors de X), et on prend pour 
I (a) l’intervalle a < .y < a\ où a" E X 
est choisi comme ci-dessus ; et si a est l’ex- 
trémité droite de X, on choisit arbitraire- 
ment, en dehors de X, un a" > a, et on 
prend pour l(a) l’intervalle a < x < a", 
où a' EX est choisi de telle sorte qu’on ait 
a < a et que f soit constante à 10~^ près 
dans l’intervalle a < x < a. Les interval- 
les I(a), pour tous les a E X, jouissent alors 
des propriétés suivantes (fig. 3) : 


fig. 3 



(a) chaque \{à) contient a (de sorte que 
X est contenu dans la réunion des I(a)) ; 

(b) chaque I(u) est ouvert, c’est-à-dire 
de la forme ]a\ a”[, donc défini par 
des inégalités strictes de la forme 
a ' < .y < a" ; 

(c) l’intersection de X et de I (a) peut se 
décomposer en trois intervalles au plus sur 
chacun desquels la fonction / est constante 
à 1 0 p près ; si par exemple a est distinct 
des extrémités de X, ces trois intervalles 
sont ]a\ a[, [ a , a] et ]a , a"[ ; (noter qu’un 
intervalle peut fort bien être réduit à un 
seul point). 

En raison de la propriété (c) ci-dessus, 
il suffirait, pour achever la démonstration 


du théorème 6, de prouver que l’on peut 
trouver des points a b a n E X en nom- 
bre fini tels que X soit contenu dans la 
réunion des intervalles I (a x ), ..., I (a n ), 
puisque, en décomposant chaque intersec- 
tion X H Xiüj) en, au plus, trois intervalles 
sur chacun desquels /est constante à 10 -/7 
près, on obtiendrait alors une décomposi- 
tion de X en un nombre fini d’intervalles 
possédant chacun cette propriété. Tout 
revient donc, finalement, à établir le résul- 
tat suivant, qui peut servir à démontrer 
beaucoup d’autres théorèmes, et qui se 
généralise à beaucoup d’autres « espaces 
topologiques » que les intervalles com- 
pacts : 

Théorème 7 (Borel-Lebesgue chez les 
francophones, Heine-Borel à l’étranger). 
Soit X un intervalle compact. Pour tout 
a E X, soit \(ci) un intervalle ouvert conte- 
nant a. 11 existe alors des points a h ..., a n 
de X en nombre fini tels que tout x E X 
appartienne à l’un au moins des intervalles 
I(ai), ..., I/O- 

Soit u et v les extrémités gauche et 
droite de X, et considérons l’ensemble 
E C X des points .y E X qui possèdent 
la propriété suivante : on peut trouver 
des points a E X en nombre fini tels que 
tout point de l’intervalle compact [w, .y] 
appartienne à l’un au moins des inter- 
valles I(<3,) ; tout revient à montrer que 
v E E. On a évidemment wEE, par 
exemple, parce que l’intervalle [w, u] est 
contenu dans l’intervalle \(u). L’ensemble 
E n’étant pas vide, et étant borné supé- 
rieurement (on a .y < v pour tout .y E E) 
admet donc (théorème 1) une borne 
supérieure a < v ; nous allons montrer 
que a E E, puis que a = v, ce qui termi- 
nera la démonstration. 

Considérons en effet l’intervalle ouvert 
I(æ) = ]a\ a'[ avec a < a < a ” . Comme 
a — sup (E), il existe un y E E tel que 
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a < x < a. Comme x G E, l’intervalle 
[m, x] est contenu dans la réunion d’un 
nombre fini d’intervalles Ifaj), l(a p ) ; 
posant a p+x =a , il est alors clair que 
l’intervalle [w, a], réunion de [w, x] et de 
[x, a], est contenu dans la réunion de 
..., I(a /J+1 ). Cela montre que a GE. 

Montrons enfin que a = v. Supposons 
en effet a < v. Posant I (a) = ]a\ a”[, 
comme ci-dessus, il existe évidemment des 
.y G X tels que a < x < a" ; pour un tel x, 
l’intervalle [ u , x] 9 réunion de [«, a] et de 
[i a , .y], est contenu dans la réunion de [ u , a] 
et de I(a) ; comme l’on peut « recouvrir » 
[; u , a] à l’aide d’un nombre fini d’intervalles 
I (a,) comme on vient de le démontrer, il en 
est donc de même de [u, x]. Par suite, 
x GE ; ce qui est absurde puisque x est 
strictement supérieur au nombre 
a = sup (E). On a donc bien a = v, ce qui 
démontre le théorème 7, ainsi par consé- 
quent que le théorème 6. 

Les exemples les plus simples de fonc- 
tions réglées sont les fonctions continues. 
On dit qu’une fonction / est continue en 
un point a si elle admet en ce point des 
valeurs limites à droite et à gauche et si de 
plus on a f(a - 0) =f(a) =f(a + 0). 11 
revient évidemment au même de dire 
qu’une fonction/, définie sur un intervalle 
X (compact ou non), est continue en a si, 
pour tout p, il existe un intervalle ouvert 
I(fl) contenant a et tel que / soit constante 
à 1 0" /; près dans X H I (a). Lorsque / est 
continue en tout point de X, on dit que /est 
continue sur X. Le théorème 4 montre alors 
que, sur un intervalle compact, toute fonc- 
tion continue est intégrable , résultat classi- 
que obtenu par Darboux en 1875, et dont 
on peut aujourd’hui donner, à partir de rien 
(la notion expérimentale de nombre réel 
conçu comme développement décimal illi- 
mité), une démonstration parfaitement 
rigoureuse et complète en quelques pages. 


Parmi les fonctions réglées figurent 
aussi les fonctions monotones , c’est-à-dire 
les fonctions croissantes et les fonctions 
décroissantes ; une fonction / sur un inter- 
valle X, est dite croissante dans X si, quels 
que soient x', x " G X, la relation x' ^ x" 
implique / (x') < //y") — la valeur de / (x) 
augmente lorsque x augmente — et décrois- 
sante si, au contraire, la relation x' ^ x" 
implique f(x) ^ /(*"); ne pas se fier, 
pour ces notions, aux définitions bizarres et 
compliquées, bien que prétendument 
« intuitives », que l’on trouve encore dans 
de nombreux manuels. Pour montrer 
qu’une fonction /'croissante, par exemple, 
est réglée, on considère un point quelcon- 
que a G X et l’ensemble E des valeurs / (x) 
prises par / aux points xGX tels que 
x > a \ comme / est croissante, on a tou- 
jours /(x) > f{a) pour un tel x, et par suite 
E est borné inférieurement, donc admet 
une borne inférieure b — inf (E), dont 
nous allons montrer que c’est précisément 
la limite à droite f(a-\- 0), dont l’existence 
sera ainsi établie. Soit, en effet, p un entier 
quelconque ; il y a dans E un nombre qui est 
égal à b à 10 p près, donc un a GX 
vérifiant les relations a > a et 
b < / (a) < b + 1 0“A Pour a < x < a\ 
on a alors d’une part b < /(x) puisque 
/ (x) G E, et d’autre part aussi / (x) < 
/ ( a ), puisque / est croissante ; il s’ensuit 
que l’on a b < /(x) < b + lO - ^, dès que 
a < x < a\ ce qui prouve très exactement 
que / admet, au point a , une valeur limite 
à droite égale à b. On établirait de même 
l’existence de valeurs limites à gauche. 


5. Intégration et dérivation 

Soit X un intervalle quelconque, et / une 
fonction réglée dans X, c’est-à-dire qui 
admet des limites à gauche et à droite en 
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chaque point de X. Choisissons une fois 
pour toutes un point a de X. Pour tout 
t G X, la fonction / est réglée et donc 
intégrable dans l’intervalle compact 
d’extrémités a et t . Nous nous proposons 
d’étudier la fonction F définie sur X par les 
formules suivantes : 

(15) F (/) = ^f(x)dx sia < t, 

F (/) = —^ a f(x)dx si t < a. 

Notons qu’en convenant de définir : 

(16) \ b f{x)dx = — \ a f{x)dx, lorsque a ^ b 

J a J b 

on a : 


f (o = l'mdx 


pour tout t C X ; 


nous dirons que F est la primitive de f au 
point a. On a évidemment F (a) = 0. 

Les deux outils essentiels pour l’étude 
de F sont d’une part l’inégalité (10) 
démontrée plus haut, et d’autre part la 
relation : 


(17) f b f(x)dx = \ c f(x)dx + f b f(x)dx, 

Va va v c 

valable quels que soient a, b, cG X, et dont 
l’analogie avec la célèbre « relation de 
Chasles » : 


AB = AC + CB 

de la théorie des segments de droite 
orientés est évidente. La démonstration de 
(17) consiste d’abord à utiliser la relation 

(16) et des calculs triviaux pour ramener la 
démonstration de (17) au cas où l’on a 
a ^ c ^ b ; on vérifie alors (17) immédia- 
tement lorsque / est une fonction étagée en 
utilisant la définition (1 ) de l’intégrale, puis 
on passe de là au cas général en appliquant 

(17) à des fonctions étagées «très voisi- 
nes » de / et en utilisant des arguments 


d’approximation analogues à ceux qui 
nous ont servi pour établir par exemple le 
théorème 4. Intuitivement, la relation ( 1 7) 
exprime que faire comprise entre le gra- 
phe de / l’axe des x, et les verticales a et 
ù, est somme de faire analogue comprise 
entre les verticales a et c , et de faire 
analogue comprise entre les verticales c et 
ù, ce qui est « évident géométriquement », 
c’est-à-dire aussi longtemps qu’on n’exige 
pas de véritable démonstration... 

Cela fait, revenons à la fonction F (/). 
Pour un t G X distinct de l’extrémité droite 
de X, on a t h GX pour tout nombre 
h > 0 suffisamment petit. Comme /admet 
en t une limite à droite /(/ + 0), il y a, pour 
tout entier /?, un nombre t P > t dans X tel 
que la relation t < t h < t p implique 
| f(t + h) - f{t + 0)| < 10+ Posons 
b =f(t + 0) et considérons, pour un tel A, 
l’intégrale : 

(18) j t + h [f(x)-b]dx 

— J r + V (x) dx — j l + h b.dx 

= F(f + h) — F(r) — bh, 

puisque : 

F(f + h) — F(r) = [ + h f(x)dx- [f{x)dx 

va va 

= j“f(x)dx -f j‘ + h f(x)dx = j t + h f(x)dx. 


Comme \f(x) — b \ < 10 _/? pour 
t < x < t + /?, et comme les valeurs de 
f(x) — b , aux extrémités, n’ont évidem- 
ment aucune influence sur le calcul de 
l’intégrale, le premier théorème de la 
moyenne (10) montre que l’on a : 


J ' + * [/«*)-*]<& 


< 10 -p h ; 


de là et de (18) résulte donc que l’on a : 
(19) | F (t + h) — F (r) — bh\ < 10 -pJi 
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dès que t < t h < t p , ou, puisque 
h > 0, que : 

(20) F(/ +/>) — F(<) _ b ' ^ i 0 _, 

dès que t < t h < t p . 

On est ainsi conduit à dire qu’une 
fonction F admet en un point / une dérivée 
à droite égale à b si, pour tout entier /?, il 
existe un nombre i p > t tel que l’on ait la 
relation (20), ou, si l’on préfère (poser 
t = t h p ), un nombre h p > 0 tel que la 
relation : 

(21) 0 < h < h p implique : 

F (, + A )- F (,) _ 6 jo _, 

h 

le rapport [F ( t -F h) — F (/)]//; représente, 
géométriquement, la pente de la droite 
joignant les points ( t , F (/)) et 
(t + h , F (/ + h)) du graphe de F. On 
désigne habituellement la dérivée à droite 
au point /, si elle existe, par F /(/). 

On définit bien entendu de même 
la notion de dérivée ci gauche au point t : 
c’est un nombre e possédant la pro- 
priété que, pour tout p, il existe un nom- 
bre h p < 0 (aucun rapport avec ce que 
nous avons désigné ci-dessus par h p ) tel 
que : 

(22) h p < h < 0 => 

! g ^ +/,)- F (0 _ c ; iq-^ 

! h i 

Le raisonnement qui, pour la primi- 
tive F de f nous a conduit à la relation (19) 
avec b = /(/ 0) conduirait, moyennant 

des modifications triviales, à la relation 
(22) avec cette fois c—f(t — 0). En 
résumé : 

Théorème 8. Soit / une fonction réglée 
sur un intervalle X, et 

F (O = j‘f(x)dx 
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la primitive de /en un point a de X. Alors 
la fonction F admet en chaque point /EX 
des dérivées à droite et à gauche données 
par : 

(23) Fi (O =f{t + 0), F ;(/) =/(/- 0). 

Le cas le plus fréquent est celui d’une 
fonction / partout continue ; alors 
Fi(/) = Fç(/) pour tout /EX, ce qui 
exprime que la fonction F admet en 
chaque point / E X une dérivée 
F'(/) — F//) =F i(/), donnée, puisque 
/(/-0)=/(/-h0) =/(/), par : 

(24) F'(/) =/(0- 

Nous allons maintenant montrer que 
cette relation suffit pour caractériser pres- 
que entièrement la fonction F, de sorte que 
le calcul des intégrales portant sur la fonc- 
tion f reviendra à la détermination dune 
solution F de l'équation (24) ; c’est là le 
cœur même du « calcul infinitésimal » tel 
que le concevaient les analystes du 
xvii e siècle. 


6. Détermination d'une fonction 
par sa dérivée 

Soit F et G, deux fonctions admettant en 
un point / des dérivées F'(/) et G'(/) : on 
voit facilement qu’alors les fonctions 
F + G, F — G et FG admettent aussi, au 
point /, des dérivées données par des 
formules simples, et égales respectivement 
à : 

F'(/) + G'(0, F ' (/ ) — G ' (/ ), 

F ' (/) G(t ) + F(/ ) G ' (/ )■ 

La meilleure façon d’établir ces résul- 
tats est d’utiliser la notation de Landau et 
d’écrire, ce qui est clair d’après (19), 
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qu’une fonction F admet au point t une 
dérivée égale à b si et seulement si l’on a 
la relation : 

(25) F(/ + h) = F (t) + bh + o(h) 

lorsque h tend vers 0 ; écrivant de même 
que : 

G(r + A) = G(f) + cA +0 (h) 

lorsque h tend vers 0, avec c = G'(0. on 
en déduit par addition que : 

F (t + h) + G(t + h) 

= F(r) + G(0 + {b + c)h + o (A), 

d’où l’existence et le calcul de la dérivée de 
F + G... 

Cela dit, et en nous bornant aux fonc- 
tions dérivables pour éviter des complica- 
tions secondaires (mais les résultats que 
nous allons établir seraient encore vala- 
bles, moyennant des modifications trivia- 
les, pour des fonctions admettant partout 
des dérivées à droite et à gauche), consi- 
dérons deux solutions F! et F 2 de l’équa- 
tion (24) ; la fonction F = F t — F 2 admet 
alors dans l’intervalle X considéré une 
dérivée : 

F'(0 - f'ko-F'.co =/(/)— /(O = o. 

On est alors amené à établir le résultat 
suivant : 

Théorème 9. Soit F une fonction définie 
dans un intervalle X et admettant, en tout 
point de X, une dérivée égale à 0. Alors la 
fonction F est constante dans X. 

Si l’on admet ce théorème, on voit que 
deux solutions quelconques de (24) diffè- 
rent entre elles d’une simple constante. Si 
donc l’on connaît une solution F de (24), 
et si l’on choisit un point a de X, on aura 
une relation de la forme : 

( 26) Jy«<** = F(<)+c, 


où c est une constante indépendante de t. 
En particulier, pour t — a, on obtient la 
relation : 

0 = F (a) + c, 

d’où : c = — F(a) et J f / (*) dx = F (/) — F(a). 
Autrement dit : 

Théorème 10. Soit / une fonction conti- 
nue dans un intervalle X et F une fonction 
dérivable dans X telle que F'(0 = fit) 
pour tout t €E X. On a alors : 

(27) J*/C*)<fe = F(6)-F(«), 

quels que soient a , Z) E X. 

C’est ce qu’on appelle fréquemment le 
théorème fondamental du calcul infinitési- 
mal puisqu’il montre l’équivalence entre 
les deux problèmes suivants : calculer 

J V(*) dx 

pour toutes les valeurs possibles de a et h ; 
trouver une fonction F telle que 
F'(0 — / (0 quel que soit t. Si, par exem- 
ple, l’on sait que la dérivée de la fonction 
a 15 est 15a 44 , de sorte qu’on a F'(/) — f ( t ) 
si /(/) = a 14 et F(r)=A l5 /15, on peut 
immédiatement écrire : 


quels que soient a et b , sans autre calcul. 

7. Théorème des accroissements 
finis 

Il nous faut maintenant démontrer le 
théorème 9, c’est-à-dire prouver que l’on a 
F(tf) — F(6), quels que soient a et b dans 
X. L’idée de la démonstration est d’une 
extrême simplicité, et fort ingénieuse. Elle 
consiste à observer que, si l’on contemple 
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le graphe F dans l'intervalle ]a, b[, on peut 
trouver un point c de cet intervalle où la 
tangente au graphe de F (fig. 4) est 


fig. 4 



parallèle à la « corde » joignant les points 
(< a , F(c/)) et ( h , F '(b)) du graphe ; si 
F(a) ^ F(/>), cette corde n’est pas hori- 
zontale, la tangente en c non plus, et Ton 
a par suite F'(c) =£ 0, contrairement à 
l’hypothèse ! 

Mais ce raisonnement purement géo- 
métrique doit être rendu rigoureux grâce à 
une démonstration effective de l’existence 
du point c en question. Noter que la pente 
de la corde joignant les points ( a , F(«)) et 
( b , F(/>)) est égale à : 

F(E) — F (g) 

b — a 

Nous sommes donc ramenés, pour 
établir le théorème 9, à établir le résultat 
bien plus utile encore que voici : 

Théorème II (formule des accroisse- 
ments finis). Soit F une fonction dérivable 
dans un intervalle compact [< a , b]. Il existe 
un point c G ]a, b[ où l’on a : 

( 28 ) F(c) = MrfW. 

b — a 


(Par une fonction dérivable sur [a, b] 
nous entendons une fonction qui admet 
une dérivée en tout point v tel que 
a < x < b, ainsi qu’une dérivée à droite en 
a et une dérivée à gauche en b. On démon- 
tre souvent le théorème 1 1 sans supposer 
l’existence de ces dérivées en a et b.) 

Notons d’abord qu’/Z suffit d établir le 
théorème 11 pour les fonctions F telles que 
F (a) = F (b). Supposons-le en effet établi 
moyennant cette hypothèse supplémen- 
taire, et substituons à la fonction F donnée 
la fonction : 


0(0 = F(0 


F(6)-F(a) 
b — a 


0 t-a ); 


on a évidemment G(a) = F (a), et G(b) 
= F (b) - [F(b) - F (a)] = F(a) = G (a). 
De plus, il est clair que G admet partout 
dans X une dérivée donnée par : 

(29) G’(t ) = F(/) - F( -^~ F -^ . 

b — a 


puisque la dérivée d’une fonction linéaire 
et -F d est égale à c. Établi pour G, le 
théorème 1 1 exprime l’existence d’un nom- 
bre : 


cE]a,b[ où G'(c) = 


G{b)-G(a) 
b — a 


= 0, 


ce qui, d’après (29), fournit aussitôt la 
relation (28) pour la fonction F. 

Nous pouvons donc bien supposer 
F(tf) = F(Z>) = 0 ; le théorème 1 1 
s’énonce alors comme suit : 

Théorème II bis. Soit F une fonction 
rlprix/ohlp rlcmc lin pAtrinopt T n Al 

wvii»uuiv uuiiu un niivi v uiiC wUiiipuvi [t< ^ i/j 

et telle que F(«) = F (b). Il existe un point 
c G ]a , b[ où l’on a F'(c) = 0. 

Ce résultat est connu sous le nom de 
« théorème de Roîle », académicien fran- 
çais de la fin du xvn e siècle, et resté célèbre 
pour avoir eu le premier, du moins le 
suppose-t-on, l’idée géométrique d’une 
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démonstration du théorème 1 1 bis. Cette 
idée, identique à celle que nous avons 
exposée au début de ce chapitre, consiste 
à remarquer que le théorème 1 1 bis 
exprime l’existence d’un point du graphe 
de F où la tangente à celui-ci est horizon- 
tale ; et la meilleure façon de trouver un tel 
point (c’est du moins l’impression que l’on 
retire d’une réflexion géométrique simple) 
consiste à le chercher parmi les points où 
la fonction F est maximum ou minimum 
(fig. 5). 



Supposons en effet trouvé un point c 
vérifiant les conditions suivantes ; on a : 

(30) a < c < b et F(x) < F(c) 

pour tout a'E [a, b]. Le rapport : 

F (c + h) — F (c) 
h 

défini pour tout h ^ 0 assez petit (parce 
qu’on suppose c distinct des extrémités a 
et b de l’intervalle considéré) est alors 
positif ou nul pour h < 0 (quotient de 
deux nombres négatifs), et négatif ou nul 
pour h > 0. Mais si\h \ est suffisamment 
petit, ce rapport est égal, à 10~ /; près, à 


F'(c) ; on en conclut que F '(c) doit être à 
la fois positif et négatif, ce qui prouve que 
F'(c) = 0. On parviendrait évidemment à 
la même conclusion en supposant : 

(31) a < c < b et F(x) ^ F(c) 

pour tout x C [a, b]. 

On voit ainsi qu’en définitive les théo- 
rèmes 9, 10 et 11 reposent sur l’existence 
d’un point c vérifiant soit les conditions 
(30), soit les conditions (31). 


8. Théorème du maximum 

Comme nous allons le voir, il suffit pour 
cela d’établir le résultat suivant : 

Théorème 12. Soit F une fonction défi- 
nie et continue sur un intervalle compact 
X. Il existe un c'EX tel que l’on ait 
F(x) < F(c') pour tout x£X, etunc*"EX 
tel que l’on ait F(c") < F(x) pour tout 
xGX. 

Avant d’établir le théorème 12, mon- 
trons comment il implique le théorème 1 1 
bis. Tout d’abord la fonction F du théo- 
rème 1 1 bis , étant dérivable en tout point 
de X, est continue. En effet, pour tout 
t C X, il existe, d’après les relations (21 ) et 
(22), que l’on écrira pour p = 0, des 
nombres lï et h" tels que l’on ait 
li < 0 < IT et tels que : 

(32) h'<h<h”=> 

\F(t h) — F(/) — F'(t)h\ < \h\ 

(le cas où h — 0 est exclu de (21) et (22), 
mais se traite directement par vérification 
triviale). Posant M = 1 + | F '(t) |, on en dé- 
duit que l’on a | F(/ + h) — F(/) | < M | h \ 
pour !ï < h < h". Choisissons un entier n 
tel que M < 10"; alors Mj/? |< 10" /7 
pourvu que | h \ < 1 0 Les f tels que le 

nombre h = t' — t vérifie à la fois fi < 
h < h" et | h | < 10' /r “" forment un inter- 
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valle ouvert I(/) contenant le point t, et le 
raisonnement précédent montre que, pour 
t'GXni(t), on a | F(/') - F(/) | < 10A 
autrement dit que F est constante à 10"^ 
près dans X Pi I(/) : d’où la continuité de F 
en / (cf. fin du chap. 5). 

Cela dit, le théorème 12 s’applique à F, 
d’où des points c et c" dans X tels que l’on 
ait F(c") < F(x) < F(c') pour tout x E X. 
Si l’on a a < c' < b , la condition (30) est 
réalisée ; si l’on a a < c" < b, la condition 
(31) l’est, et dans chacun de ces deux 
cas le théorème 11 bis est démontré, 
comme on l’a vu. Il reste à examiner le 
cas où c et c” sont situés aux extrémités 
de X. Mais comme F(a) = F(Z>), on a 
alors F(c') = F(c") = F(a) = F(&), donc 
F(x) = F(a) = F(/>) pour tout x E X, et la 
fonction F est constante, d’où F'(/) = 0, 
quel que soit /EX, de sorte que le 
théorème 1 1 bis est trivialement vrai dans 
ce cas aussi. 

Passons maintenant à la démonstration 
du théorème 12. Tout d’abord la fonction, 
étant continue sur l’intervalle compact X, 
est réglée sur X d’après le théorème 6, 
comme nous l’avons déjà observé au cha- 
pitre 5 ; elle est donc bornée sur X : choisir 
sur X une fonction étagée cp telle que l’on 
ait par exemple | F(x) — cp(x) | ^ 1 pour 
tout x E X, désigner par u et v la 
plus petite et la plus grande des valeurs 
(en nombre fini) prises par la fonction 
cp sur X, et observer qu’on a alors 
u — 1 ^ F(x) < v + 1 pour tout x E X. 
L’ensemble F(X) des valeurs prises par la 
fonction F sur l’intervalle X est donc borné 
et admet par suite une borne supérieure M 
et une borne inférieure m (cf. chap. 1) ; 
toute la question est de prouver l’existence 
de nombres c et c" EX tels que m = F(c") 
et M = F(e') (ce qui, nous l’avons vu au 
chapitre 1, pourrait fort bien se révéler 
impossible si l’intervalle X n’était pas sup- 


posé être compact ), et nous nous bornerons 
à prouver l’existence de c\ celle de c " se 
démontrant de la même façon (ou, mieux 
encore, se déduisant de l’existence de c 
puisque c" joue pour la fonction — F le 
même rôle que c pour la fonction F). 

Or nous savons que, pour tout p , 
il existe des x EX où Ton a 
M — ÎO - /* < F(x) < M. Soit A p l’ensem- 
ble de ces x E X ; tout revient à prouver 
qu’il existe un point c commun à tous les 
A p , car si l’on a : 

M — 10 p < F(c) < M 

quel que soit p , on aura évidemment aussi 
F(c) = M. Nous allons maintenant raison- 
ner par l’absurde, en supposant que les 
ensembles A p n’ont aucun point commun 
et en déduisant de là une contradiction. 

Si les A p n’ont aucun point commun, 
alors, pour tout x E X, il existe un entier p 
tel que x E A p , c’est-à-dire tel que l’on ait 
F(x) < M — 10 -/ \ Comme F est continue 
en tout point de X, il existe alors un 
intervalle ouvert I(x) contenant x, et tel que 
F soit constante à 10 _/;_1 près dans 
X H I(x) ; pour tout x'EXO I(x) on a 
donc alors F(x) < M - 10 p + ÎO^- 1 < 
M — 10 -/ ’ -1 puisque l’on a : 


— 10+1 _ — 9^—1 

“ 10 ^+ 1 ~ 10 ' + 1 < 10' +1 ’ 

comme on le voit en observant que 
— 9 < — 1 . Désignant par q l’entier p + 1 
on voit donc que, pour tout x E X, il existe 
un intervalle ouvert I(x) contenant x et un 
entier q tels que l’on ait : 

(33) F(x')<M — io-* 

pour tout x' E I(x) Pi X. 

Appliquons alors le théorème 7 ; on 
trouve des points Xj, ..., x„ de X, en nom- 
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bre fini, et des entiers q { , ..., q n , tels que les 
conditions suivantes soient remplies ; tout 
.y E X appartient à l’un au moins des 
intervalles I(a,), I(a„), et d’autre part on 

a, d’après (33) appliqué à chaque a a , 

(34) F(x)<M — 10-»* 

pour tout a* E I(a a ) Pi X. 

Soit q le plus grand des n entiers 
q h ..., q n ; on a évidemment 1 0/ ^ KF, et 
donc : 

10 — 1 9k ^ 10 — 9, d’où M — 10 — 1 ik ^ M — 10 - 

pour tout k tel que 1 ^ k ^ n ; par suite, 
(34) montre que F(a) < M — 10 _</ pour 
tout x E X qui appartient à l’un au moins 
des I(a a ), c’est-à-dire pour tout a E X sans 
exception. Mais on aboutit ici à une 
contradiction puisque, par définition de la 
borne supérieure M de la fonction F, il 
existe certainement des x E X où l’on a 
F (a) > M — 1 0 q . Le théorème 1 2 est 
donc démontré, et avec lui les théorèmes 
11, 10 et 9. 


9. Formule de Taylor 

Nous allons maintenant établir le dernier 
« grand » résultat de l’analyse infinitési- 
male, à savoir la formule de Taylor, qui 
permet, au voisinage d’un point, de rem- 
placer une fonction « suffisamment régu- 
lière » par un polynôme qui lui est « appro- 
ximativement » égal. 

Soit / une fonction définie dans un 
intervalle ouvert X. Nous dirons que / est 
de classe C 1 dans X si elle admet une dérivée 
/'(a) en tout point de X, et si celle-ci est 
fonction continue de a. Si/' est elle-même 
de classe C 1 , on dit que / est de classe C 2 ; 
on peut alors attribuer à / une dérivée 
seconde continue/" = (/')'. En poursui- 
vant ainsi de proche en proche on définit de 


façon évidente les dérivées successives, et la 
notion de fonction de classe O 7 , c’est-à-dire 
admettant dans X des dérivées continues 
jusqu’à l’ordre p inclusivement. 

Supposons / de classe C 1 dans X, et 
appliquons le théorème 10 à la fonction 
continue /' ; on trouve que : 

(35) m-m = \ b f(x)dx, 

quels que soient a, b E X. 

Soit maintenant u et v deux fonctions de 
classe C 1 dans X ; la fonction w = uv l’est 
aussi et sa dérivée est donnée par la 
formule w' = uv uv\ que nous avons 
déjà indiquée après l’énoncé du théo- 
rème 1 1 . On en déduit que : 

w(b) — w(a) = J 6 [u ’ (x) v(x) + u {x) v'(x)3 dx 

= F u ’ (x) v (a) dx + j u (a) v " (x) dx t 

va va 

d’où la formule d'intégration par parties : 

(36) u' (x)v(x) dx 

= u(b)v (b) — u(à)v(a) — J 6 u (x) v ' (x) dx , 

valable pour u et v de classe C 1 dans X, très 
commode pour le calcul pratique des 
intégrales, mais dont l’intérêt est ailleurs 
lorsqu’on s’occupe de mathématiques. 
Nous allons obtenir la formule de Taylor 
en combinant les formules (35) et (36). 

Pour cela supposons, dans (35), que / 
soit de classe C 2 et donc /' de classe C 1 . 
Appliquons la formule (36) en choisissant 
u(x)=x — b, d’où u( a') = 1, et 
v(a) — /'(a), d’où v'(a) = /"(a) ; il vient 
u(b) = 0, u(a) = a — b, v(b) — /'(/?), 
v(a) =/'(a), d’où : 


/(*)-/(«) = JV w*** 

—f(. a )(p — a) — JV W (* - *) dx - 
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Supposons maintenant / de classe C 3 , 
donc /" de classe C 1 ; on peut calculer 
la dernière intégrale en faisant 
u(x) =f" (x) et v(x) = (x — h) 2 / 2 dans la 
formule (36), puisque alors v' (x) — x — 
a ; il vient donc, puisque v(b) = 0 : 

f(b ) -fia ) =f{a ){b — a) — { -f'\a )(a - b )V2 

— JV w (*) ^ 2 — dx) 

= f(a)(b-a)+r(b-ay/2 

+ \ b r( X) ^d X . 

Si / est de classe C 4 , on peut calculer 
la dernière intégrale en prenant, dans 
la formule d’intégration par parties, 
«(x) — (x) et v(x) = (x — b) 3 / 2.3 ; 
comme v(&) = 0, il vient alors manifeste- 
ment : 

f(b ) -fia ) = f\a ){b — a) + f’\a \b - a )V2 
+ r (a )(6 - a y/2.3 - J*/* " M dx. 

Il est clair que le raisonnement se 
poursuit aussi longtemps que les dérivées 
existent et sont continues. Autrement 
dit, si / est de classe on a la rela- 

tion : 

(31)f(b)-f(a) =f'(a){b-a) +/»(/>-<0 2 /2 + ... 

+f<p)(a)(b- a y/p\ + R p , 

où l’on a posé p ! = 1 .2 ....p (produit 
des p premiers nombres entiers), et 
où l’expression R /? est donnée par la 
relation : 

(38) R„ = (- 1)^ f 1 > + »(* ) dx 

va P ■ 

= + 

J a P ' 

La formule de Taylor avec reste intégral 
est la relation : 

(39) f{b ) =f(a ) +f{a ){b-a) +/> )(b-a )V2! + ... 

+f<p){a){b-aY/p\ + R p , 


qui se déduit immédiatement de (37). Si 
l’on fixe le point a en remplaçant b par un 
point variable t G X, on obtient la relation : 

(40) f(t) =f(a ) +f (a) (t- a) +/" (a) (/ - a)V 2! +... 

+ f<p){a){t-ay/p\ + R p {t), 

qui exprime / comme somme d’un poly- 
nôme en t et d’un « reste » : 

(4i> R p ( t )= [fip+')(x) ( t=yfdx. 

va P ' 

Noter que le polynôme en question 
possède, au point a, les mêmes dérivées que 
la fonction f jusqua l’ordre p inclusivement \ 
ce qui le caractérise entièrement puisqu’il 
est de degré p au plus. 

La formule de Taylor n’a pas d’intérêt si 
l’on ne connaît pas de méthode simple pour 
évaluer l’ordre de grandeur du reste R /? 
dans (39) ou (40) puisque, dans la pratique, 
on désire toujours s’en servir pour appro- 
cher la fonction / par le polynôme de degré 
p considéré ci-dessus. Supposons pour cela 
a < b dans (38), l’autre cas se traite de 
même, avec des changements de signe 
triviaux dans les raisonnements, de sorte 
que l’on a (b — xf ^ 0 pour a ^ x < b. 
Soit m et M le minimum et le maximum, 
dans l’intervalle compact [a, b], de la fonc- 
tion continue /^“^(x) ; on a alors : 

( 42 ) r m (b - xy dx= m r (b -y p dx 

r*M 

P J a p ! J a pl 

de sorte que tout revient à évaluer l’inté- 
grale : 

(43) f b( È=ft dx . 
va P * 

Pour cela, appliquons la formule (39) à 
la fonction f(x) — (x — o/ +1 /(P + 1) K 
dont les dérivées successives sont 
(x — af/p !,..., x — a et 1 pour la dérivée 
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d’ordre p + 1 ; les dérivées d’ordre < p 
sont nulles pour x = a, de sorte que, pour 
cette fonction, la formule (39) se réduit 
à son reste, précisément égal à (43) puis- 
que l’on a, pour la fonction considérée, 
/ (/,+1) (x) — 1 pour tout x ; d’où la valeur 
de l’intégrale (43), à savoir : 

(44) f ^Xr*y dx = «L-J^l\. 

K ’ J a pi <p+ 1)1 

Portant dans (42) on trouve donc, pour 
le reste (38) associé à une fonction / de 
nouveau quelconque, les inégalités : 


(45) m 


(b—ay + 1 
(P + 1) f 


< Rp < M 


(b — a)P + 1 

‘F+ÏÏT' 


ce qui montre encore que l’on a : 


(46) R p = k 


(b — à)P + 1 

T+ÏÏT 


avec 


m < fc < M. 


On ne connaît pas exactement le nom- 
bre k, mais on sait qu’il est compris entre 
le minimum et le maximum, sur l’intervalle 
[ a , b], de la fonction continue / (/,+ 1) (x) ; en 
appliquant à f (p+l) le théorème 14 qui sera 
démontré ci-dessous, on en conclut qu’il 
existe dans l’intervalle [a, b] un point c où 
l’on a k =/ (p+1) (c) ; portant dans (46) et 
(39), on obtient finalement le résultat 
suivant : 

Théorème 13. Soit / une fonction de 
classe C /,+1 sur un intervalle X. Quels que 
soient les points a et b de X, il existe un 
nombre c compris entre a et b et tel que 
l’on ait : 


(47 )/(*)=/(«) +/'(«)(*-«) 

+r{a)(b-a)V 2! 

+ ... — «y//?! 

+f<P + i)(c)(b—a)P + V(p+ 1)L 

il nous reste à établir le théorème 14, 
auquel nous avons fait allusion plus haut ; 
c’est, de toute façon, l’une des propriétés les 
plus importantes des fonctions continues. 


Théorème 14. Soit m et M le minimum 
et le maximum d’une fonction continue sur 
un intervalle compact [ a , b]. Pour tout 
nombre k compris entre m et M, il existe 
un nombre c compris entre a et b et tel que 
k =f(c). 

On sait (théorème 12) qu’il existe dans 
[ a , b] des points a et b' où /(«') = m et 
/(//) = M ; remplaçant l’intervalle [ a , b] 
par l’intervalle [a\ b'], on est encore 
ramené à l’énoncé suivant (« théorème des 
valeurs intermédiaires », fig. 6) : 



Théorème 14 bis. Soit / une fonction 
continue sur un intervalle X, a et b deux 
points de X, et k un nombre compris entre 
a et b. Tl existe un nombre c compris entre 
a et b tel que f(c) = k. 

Pour fixer les idées, supposons a < b et 
f(a) < k < f(b). Soit E l’ensemble des 
points x E [ a , b] où l’on a f(x) ^ k ; 
l’ensemble E n’est pas vide (on a visible- 
ment a E E), et il est borné supérieurement 
(on a .y < b pour tout x E E) ; il admet 
donc (théorème 1) une borne supérieure c. 
Comme x < b pour tout x E E on a aussi 
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c < b ; comme a G E on a aussi a < c, de 
sorte que c G [a, £]. Nous allons montrer 
qu zfic) — k, ce qui prouvera le théorème. 
Il suffit pour cela de montrer que Ton ne 
peut avoir ni fie) > k , ni fie) < k . 

Supposons que Ton ait fie) > k. On 
aurait alors a ^ c puisque fia) € k, et 
donc aussi a < c. D’autre part, il existerait 
un entier p tel que l’on ait encore : 

(48) /(c) > k + 10—*, 

puisque l’inégalité fie) > k est stricte. 
Mais /est continue au point c ; il y a donc 
un intervalle ouvert I(c) contenant c et tel 
que / soit constante à 10 _/J près dans 
[a, b ] H I(c). Comme a < c, cette intersec- 
tion contient au moins un c' tel que 
a ^ c' < c, donc contient tout l’intervalle 
[c, c], lequel, puisque c = sup (E), 
contient certainement un x E E. On a alors 
fix) < k , puisque i E E, et : 

\f(x)-f(c)\<\0~p, 

puisque x C I (c), d’où : 

f(c) </(*) + 10~ * < k + 10-*, 

ce qui contredit (48). L’éventualité dans 
laquelle on aurait fie) > k est donc exclue. 

Supposons maintenant que l’on ait 
fie) < k. Comme k ^ fib ), on a alors 
certainement e < b. Comme, d’autre part, 
l’inégalité fie) < k est stricte, il existe, 
comme plus haut, un entier p tel que l’on 
ait : 

(49) f(c) < k — 10-*. 

Mais f est continue au point e ; il y a 
donc, comme plus haut, un intervalle 
ouvert I(c) contenant e et dans lequel la 
fonction / est égale, à 10“^ près, à /(c). 
Comme c < b, il y a un c " E I(c) H [a, /?] 
tel que c < c", et, comme on a |/c") — 
fie) | < 10-', il vient : 

/(O </(c) + 10-* < k 


d’après (49). Par suite c" E E ; mais c’est 
absurde puisque c' dépasse strictement la 
borne supérieure e de l’ensemble E. Le 
théorème 14 bis est donc démontré, et, 
avec lui, la formule de Taylor. 

Les applications principales de la 
formule de Taylor concernent les dévelop- 
pements en série des fonctions « élémen- 
taires » : fonctions trigonométriques, 

exponentielles, logarithmiques, etc. (cf. 
EXPONENTIELLE ET LOGARITHME, FONCTIONS 

analytiques). On trouvera également, 
ci-après, l’extension de la formule de Tay- 
lor aux fonctions de plusieurs variables. 

ROGER GODEMENT 
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B. Calcul à plusieurs variables 

Le calcul infinitésimal des fonctions de 
plusieurs variables a eu un développement 
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plus tardif que celui des fonctions d’un seul 
argument. Inauguré avec un siècle de 
retard, il ne parvient à établir solidement 
ses fondements qu’au début du xx e siècle. 

Ce n’est qu’aux environs de 1930 que 
sont abordés les problèmes difficiles de 
cette branche de l’analyse, très utilisée 
depuis lors. 


1. La préhistoire 

Le formalisme 

des dérivées partielles 

Avant d’étudier le comportement d’une 
fonction / (xj>) de deux variables, lorsque 
x et y varient simultanément et indépen- 
damment , on commence par faire varier x 
et y successivement. Fixons la valeur de y : 
la dérivée de la fonction x ► f(x,y), 
lorsqu’elle existe, s’appelle la dérivée par- 

rtf 

tielle — (x,v) de / par rapport à x (à y 
ex 

constant). La notation utilisant le d pour 
désigner la dérivation partielle, par oppo- 
sition au d désignant la dérivation ordi- 
naire, a été préconisée par Legendre 
(1786) et vulgarisée par Jacobi (1841). 
Si, maintenant, on fait varier x et y en 
fonction d’une même variable t, on trouve 
que : 

( 1 ) 

= S + d { t < [*('), .KO], 

ce qui fait apparaître les dérivées partielles 
de / comme des intermédiaires de calcul 
commodes. 

Les dérivées partielles apparaissent, en 
1755, dans le traité Institutiones calculi 
differentialis d’Euler, et, en 1747, chez 
A. Clairaut. Ils y ont reconnu l’outil de 
base du calcul différentiel à plusieurs 


variables. Malheureusement, cette notion 
est essentiellement liée au choix d’un 
système de coordonnées. 

Par exemple, considérons les formules 
W — RI 2 = El — E 2 /R, qui traduisent un 
cas particulier des lois d’Ohm en électri- 
cité. On constate que le symbole dW/dl est 
égal à 2 RI, E ou 0 selon l’expression de W 
que l’on adopte. L’explication de ce para- 
doxe vient de ce que la dérivation par 
rapport à 1 n’a pas la même signification 
selon que l’on opère à R constant (et E 
variable), ou à E constant (et R variable) 
et enfin si l’on fixe E et R. 

S’inspirant de ce que Leibniz avait fait 
pour la différentielle des fonctions d’une 
variable, Euler et Clairaut étudièrent une 
expression remarquable, la différentielle 
totale : 

(2) df = ( x,y)dx + (x,y)dy ; 

c’est une fonction de quatre variables 
indépendantes x, y\ dx, dy (linéaire par 
rapport aux deux dernières). Cette expres- 
sion possède un caractère invariant 
lorsqu’on la soumet à des changements de 
variables du type particulier suivant : si 
l’on exprime x et y en fonction de nouvelles 
variables X,Y au moyen des formules 
x = x (X,Y), y = y (X,Y), et si l’on effec- 
tue, en même temps , le changement de 
variables « covariant », selon les formules : 

dx =^{X,Y)dX + ^(X,Y)dY, 

dy = |£(X,Y )dX + ||(X,Y)rfY, 

on constate que la différentielle totale de/ 
prend la même forme (2) que l’on exprime 
df à l’aide de x, y, dx et dy ou à l’aide de 
X, Y, dX et (N. 

Les dérivées partielles sont susceptibles 
d’être dérivées partiellement à leur tour. 
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On obtient ainsi les dérivées partielles 
secondes : 

d_(àf\ Ll*f\à_(àf\ d_(V\ 

dx \dx / * dy\dy ) dx\Ôy ) ôy\dx) 

que Jacobi note respectivement : 

ô 2 f ô 2 f ô 2 f d 2 f 

dx 2 ôy 2 dyôx ôxdy 

Euler et Clairaut avaient déjà constaté 
que le résultat ne dépend pas de l’ordre 
dans lequel on effectue les dérivations 
(pour autant que ces auteurs n’opéraient 
tacitement que sur de « bonnes fonc- 
tions », c’est-à-dire des fonctions que nous 
nommons aujourd’hui analytiques), soit : 

^ ' ôxdy ôyôx 

À titre de preuve, Euler se borne à 
invoquer la symétrie de l’expression : 

/(* + h, y + k) ~ f(x,y + k ) 

— f(pc + h, y) +/(*,,?). 


nomes C [X,Y] à deux indéterminées X et 
Y. » (Par exemple, à l’opérateur cité 
ci-dessus correspond le polynôme AX + 
BY 2 — CXY 2 .) L’isomorphisme précédent 
s’explique par l’analogie complète qui 
existe entre les règles de calcul qui régis- 
sent l’addition et la multiplication des 
polynômes d’une part, l’addition et la 
composition des opérateurs différentiels à 
coefficients constants d’autre part. Parmi 
ces règles, la formule (3) exprime la 
commutativité des dérivations partielles. 
Mais, au xvm e siècle, de telles explications 
ne pouvaient être pleinement comprises : 
les calculateurs imaginaient une profusion 
de règles de calcul « symboliques », dont 
l’efficacité restait mystérieuse. 

Voici une application des considé- 
rations précédentes. En tenant compte 
de l’isomorphisme précité, on peut déve- 
lopper l’opérateur (ô/ôx -b d/dy) itéré n 
fois, grâce à la formule du binôme de 
Newton : 


et Clairaut opère formellement sur un 
développement en série. 

Une combinaison linéaire à coefficients 
complexes de dérivations partielles 
s’appelle un opérateur différentiel linéaire 
à coefficients constants (par exemple : 

d_ d 2 â 3 

dx ôy 2 ôxdy 2 ’ 

où A, B, C sont des nombres complexes). 
Ces opérateurs sont susceptibles d’être 
ajoutés et composés entre eux : il en résulte 
une structure algébrique sur l’ensemble des 
opérateurs différentiels à coefficients cons- 
tants qu’en langage moderne on peut 
formuler ainsi : « L’ensemble des opéra- 
teurs différentiels à coefficients complexes 
opérant sur des fonctions de deux variables 
est un anneau (pour l’addition et la com- 
position), isomorphe à l’anneau des poly- 


f â ô \« _ V' k d k d n ~ k ■ 

\dx + dy) / 4 n dx k dy n ~~ k 
k = o 

En appliquant les deux membres à la 
fonction f(x)g(y) et en remplaçant y par v 
dans le résultat, on aboutit à la formule de 
Leibniz : 


£[/(»*(»] = £ 


La théorie des équations aux dérivées 
partielles oblige à manipuler de plus en plus 
des expressions différentielles : l’impor- 
tance du laplacien : d 2 jdx 2 + d 2 /dy 1 pro- 
vient du fait que c’est (à un coefficient près) 
le seul opérateur différentiel à coefficients 
constants, homogène du second ordre, qui 
soit invariant par rotation des axes. Le 
laplacien, à cause de cette signification 
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intrinsèque, apparaît dans de nombreux 
phénomènes physiques. 

L’étude de certaines équations aux déri- 
vées partielles liées à des problèmes de 
géométrie différentielle a conduit à adop- 
ter les notations de Monge : 

_ôf _ôf _d 2 f ô 2 f 

P âx * ^ ôy’ T dx 2 ’ S Ôxôy * 



utilisées à la fin du xix e siècle, mais qui sont 
tombées en désuétude, faute de pouvoir se 
généraliser aux cas des fonctions de n 
variables, et à valeurs vectorielles. 

Euler s’est également occupé du calcul 
des dérivées d’une fonction implicite : 
partant d’une équation f {x,y ) = 0, il sup- 
pose, sans trop de scrupules, que l’on peut 
trouver une fonction x »— ► y (x) satisfaisant 
à f[x,y (x)] eee 0. Il calcule alors la dérivée 
ÿ (x) à partir de l’équation : 

d / x [x,y(x)]+f x d fx, y (x)]=0, 

et en déduit l’expression des dérivées 
successives de y. 

Étudiant de la même façon la résolution 
d’un système : 

' f \(x, y \,y 2 ,yù = o 

fi{x>y i>yi>y 3 ) = 0 

>fifr*yi*y2,yù = 0 

Jacobi introduit la notion de déterminant 
fonctionnel (appelé aussi déterminant 
jacobien) défini par : 


àfy 

ôfi 

àh 

ôy x 

à y 1 

ày\ 

àfx 

àfi 

àf± 

ày 2 

ày 2 

d y 2 

àjy 

àh 

à_h 

ày 3 

à y s 

éy 3 


de dépendance fonctionnelle analogue à 
la dépendance linéaire entre formes linéai- 
res. 

Au xix e siècle commence l’étude algé- 
brique des opérateurs différentiels linéai- 
res à coefficients variables : deux tels 
opérateurs ne commutent pas nécessaire- 
ment (on s’en convaincra en composant 
les opérateurs djdx et x (d/dx) relatifs à des 
fonctions d’une seule variable). On intro- 
duit alors diverses expressions différentiel- 
les (déterminants hessiens ou wronskiens, 
crochets de Lie, parenthèses de Poisson, 
invariants intégraux, etc.), qui préparent la 
voie au calcul différentiel extérieur, à 
l’analyse tensorielle et à la géométrie 
différentielle moderne (cf. géométrie 
DIFFÉRENTIELLE CLASSIQUE). L’aboutisse- 
ment de cet effort d’algébrisation sera 
l’édification d’une science traitant abstrai- 
tement des objets mathématiques soumis 
aux mêmes règles de calcul que les opéra- 
teurs différentiels : Yalgèbre différentielle 
ainsi édifiée s’affranchit de toutes considé- 
rations de continuité et de limite, et trouve 
des applications dans l’étude des fonctions 
définies sur un corps quelconque et 
jusqu’en arithmétique. 

En ce qui concerne les notations, un 
perfectionnement important a été apporté, 
en 1934, par H. Whitney, qui a introduit 
l’usage des multi-indices . Un multi-indice à 
n variables est un système ordonné de n 
entiers (a b a 2 , .... a J, que l’on désigne par 
un seul symbole a. Dans ces conditions, on 
écrit : 


ô a f 

dX a 


au lieu de 


fiai + ctj + ». + 

dX^dX^dX** ’ 


X a au lieu de Xi a i X 2 a * ... X„ a « ; 


on pose, de plus : 


et dégage les règles du calcul formel qui le | a | = + a 2 -I- ... + a„ 

régissent. Il met en évidence la notion et a! = a t ! a 2 ! ... a fl ! ; 
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avec de telles notations, la série de Taylor 
s’écrit alors comme une série à une varia- 
ble, mais avec une sommation étendue à 
Fensemble de tous les multi-indices : 


Z (X-Xq)° 
a! 


d a f 

■ — (Xq). 
dX a 


Formulation intrinsèque 
de la théorie 

Les inconvénients des dérivées partielles 
posèrent, dès l’apparition du calcul vecto- 
riel, le problème de la formulation intrin- 
sèque de la théorie, en mettant en évidence 
des expressions invariantes par change- 
ment de coordonnées ; M étant un point de 
coordonnées (x,y,z, ...), on ne parlera plus 
de fonctions des variables, mais de fonc- 
tions du point M. 

Une étape historique importante, 
aujourd’hui complètement dépassée, a été 
l’élaboration, par O. Heaviside et 
W. Gibbs, de l’analyse vectorielle, qui met 
l’accent sur certaines expressions invarian- 
tes par changement de coordonnées rec- 
tangulaires dans l’espace à trois dimen- 
sions. La structure euclidienne y joue donc 
un rôle primordial. À une fonction numé- 
rique M (M) = / (a,/,z) (où .y, y, z 
sont les coordonnées de M par rapport à 
une base orthonormée), on associe le 
vecteur, dont les composantes sont : 


df ôf ôf 


C’est le gradient de la fonction f II est 
lié à la différentielle totale de / par la 
formule : 

rf/= grâd/.dM, 


où le second membre représente un pro- 
duit scalaire et t/NÎ le vecteur dont les 
composantes sont dx, dy, dz. À un champ 
de vecteur M * V (M), défini par les trois 


composantes X(M), Y(M), Z(M) du vec- 
teur V, on associe une fonction scalaire, la 
divergence du champ : 


div V 


dX dY ÔZ 
dx dy dz 


et une fonction vectorielle, le rotationnel de 
V, dont les composantes sont : 


rot 


<V) = ( 


a z ay ax az ay axj 


dy dz dz dx dx dy / 


Le gradient, la divergence et le rotation- 
nel sont des notions invariantes par chan- 
gement d’axes orthonormés et sont soumi- 
ses à un grand nombre de règles de calcul 
« symboliques », dont les plus simples sont : 

rot (grad /) = 0, div (rot V) = 0. 


Ces notions permettent d’écrire, sous 
une forme concise et suggestive, un grand 
nombre de formules de la physique théo- 
rique, de la mécanique et de la géométrie. 
Par exemple, les divers cas particuliers de 
la formule de Stokes (attribués à Green, 
Ampère, Ostrogradsky, etc.) prennent la 
forme : 


ni 


f.n do , 

J i 


grad/. d t - 

J J div V .d r = JJ (V . n ) d o, 

J J J rôtV.^r = JJ n A Y do, 


où dr (resp. do) désigne l’élément de 
volume (resp. d’aire), où l’intégrale triple 
est étendue à un domaine tridimensionnel 
orienté, et où l’intégrale de surface est 
étendue au bord orienté dans ce domaine, 
n représente le vecteur normal à la surface 
considérée. 

Mais cette analyse vectorielle ne couvre 
pas l’ensemble de tous les besoins de la 
physique mathématique. Elle ne déborde 
pas le cadre des fonctions de trois variables 
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et des changements de bases orthonorma- 
les. La véritable solution du problème de 
la formulation intrinsèque du calcul diffé- 
rentiel n’a été obtenue qu’après l’édifica- 
tion de l’analyse tensorielle (par Ricci et 
Levi-Civita) et du calcul différentiel exté- 
rieur (par Élie Cartan). Bien que ces 
théories n’aient été exposées à l’origine 
qu’en termes de coordonnées, il n’a pas été 
difficile (après la construction axiomatique 
de l’algèbre linéaire et multilinéaire), de les 
traduire en langage intrinsèque. 

Le calcul différentiel extérieur explique 
l’origine (qui paraissait quelque peu mys- 
térieuse) des notions de gradient, de rota- 
tionnel et de divergence, puisque les déri- 
vées extérieures de : 

f(x,y,z), 

X(x,y ,z) dx -f Y (x, y , z) dy 4- Z (x,y,z)dz, 
X(x,y ,z) dy A dz + Y (x, y >z)dz A dx 

+ Z (x,y ,z)dx A dy 


sont respectivement : 


àf 

dx 


dx ■ 




dz A dx 


( dZ ÔY\, A , ( dX dZ) 

{ôï-Jï) dyAdz + {^-ëï) 

( ÔY ÔX\ , A , 
+ \^—^) dxhdy ’ 
(dX dY az\ . A , „ 

[e^ + lV + d^) dxAdyAdz - 


La formule de Stokes qui s’exprimait, 
nous l’avons vu, sous des formes très 
diverses et d’emploi limité dans le langage 
de l’analyse vectorielle s’écrit aujourd’hui : 

P P , 

ÛW, 

J dQ J Û 


où co est une forme différentielle, du sa 
différentielle extérieure, O une chaîne 
orientée, et ôQ le bord orienté de Q. 

Les progrès de l’algèbre linéaire ont 
permis enfin de définir la différentielle sans 
aucun recours aux coordonnées sous une 


forme qui s’applique également aux fonc- 
tions définies sur des espaces de dimension 
infinie (cf. chap. 2). 

Après que R. Gateaux et V. Volterra 
eurent dégagé la notion de dérivée direc- 
tionnelle d’une fonction définie sur un 
espace fonctionnel (établissant ainsi la syn- 
thèse entre le calcul des variations [cf. calcul 
des variations] et le calcul différentiel clas- 
sique), O. Stoltz et M. Fréchet donnaient la 
définition intrinsèque de la notion de diffé- 
rentielle. Ces travaux ont fait prendre cons- 
cience du fait fondamental suivant : pour 
traiter le calcul différentiel des fonctions 
définies sur un espace vectoriel normé E et 
prenant leurs valeurs dans un espace normé 
F, il est indispensable de manier simultané- 
ment de nombreux espaces auxiliaires obte- 
nus à partir de produits tensoriels des espa- 
ces E, F et du dual de E. En particulier, 
chacune des dérivées successives d’une 
application différentiable / doit prendre ses 
valeurs dans un espace différent. 

Cette conception oblige à manipuler 
simultanément un grand nombre d’espaces 
normés, ayant des dimensions différentes, 
ce qui n’est pas fait pour faciliter l’intuition 
géométrique. Pour obvier à cet inconvé- 
nient, C. Ehresmann a créé, en 1943 et en 
1952, deux outils extrêmement commo- 
des : la notion d'espace fibré et la notion de 
variété des jets. Grâce à ce langage, on peut 
concevoir le support géométrique du 
calcul différentiel à n variables comme un 
domaine O de l’espace à n dimensions, et, 
« au-dessus » de chaque point M de Q, on 
imagine une « fibre », formée par une 
collection d’objets mathématiques (vec- 
teurs, tenseurs, matrices, covecteurs et 
cotenseurs, etc.), dont on aura besoin pour 
décrire la théorie. La description a priori 
de la variété des jets, exprimée de façon 
intrinsèque, permet de s’affranchir de la 
manipulation de signes hérissés d’indices 
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compliqués et d’utiliser à nouveau un 
langage géométrique. 

Apparition de la rigueur 

Le flux de formalisme qui caractérise la 
première époque du calcul infinitésimal fut 
suivi par un reflux critique dans le domaine 
de la rigueur. 

Sous l’influence de Cauchy, Abel et 
Weierstrass, on se préoccupa de reprendre 
les principales formules découvertes plus 
ou moins empiriquement au siècle précé- 
dent, pour en préciser au mieux les limites 
de validité. Ainsi, H. A. Schwarz prouva, 
en 1873, que la formule : 

ô 2 f _ d 2 f 
dxdy dydx 

est valable, sous réserve de la continuité 
d'un des deux membres par rapport à 
l’ensemble des variables. Peano donna 
l’exemple de la fonction : 


prolongée par continuité en posant 
/ (0,0) — 0, pour laquelle la permutation 
des dérivées partielles n’est pas licite. 

Peano entreprit systématiquement de 
dépister les affirmations non rigoureuses, 
largement répandues à l’époque, construi- 
sit des contre-exemples, aujourd’hui clas- 
siques, et tenta de redémontrer certains 
théorèmes, sous les hypothèses les plus 
faibles possibles. C’est ainsi qu’il améliora 
l’exposition du théorème des accroisse- 
ments finis et démontra la formule de 
Taylor (cf. chap. 2), pour les fonctions 
d’une ou plusieurs variables, en éliminant 
toute hypothèse superflue ; on lui doit en 
outre la formule classique sur le reste de 
Young (trouvée par Peano avant cet 
auteur). Il signala une erreur célèbre tou- 
chant les maxima (ou minima) des fonc- 


tions : on pensait que l’inspection des 
termes de plus bas degré du développe- 
ment de Taylor, au voisinage de l’origine 
d'une fonction, ainsi que le comportement 
de cette fonction sur chaque droite passant 
par l’origine permettait de décider de 
l’existence d’un extrémum en ce point. Or 
la fonction ( y — x 2 )(j’ — 2 x 2 ), pour 
laquelle le terme de plus bas degré est y 1 , 
admet un minimum relatif nul sur chaque 
droite passant par l’origine ; cependant, 
elle prend des valeurs négatives dans tout 
voisinage de l’origine. 

Vers la même époque paraissent, dans 
les traités d’analyse, les premières démons- 
trations correctes du théorème des fonc- 
tions implicites et de quelques-unes de ses 
variantes. La préhistoire prend fin, le 
véritable développement commencera 
trente ans plus tard. 

2. Exposé moderne 
de la théorie élémentaire 

Dérivée première 

Soit E et F deux espaces normés, et Q un 
ensemble ouvert de E : on dit que deux 
fonctions continues / et g (définies sur Q 
et à valeurs dans F) admettent un contact 
d'ordre r (où r est un nombre entier) au 
point A G Q si le rapport : 

11/ (M) — g (M) |[ 

Il AM !' 

tend vers 0 lorsque M tend vers A. En 
particulier, lorsque r = 1 on dit que /et g 
sont tangentes au point A ; cette définition 
implique que /(A) = g (A). 

Une fonction continue /(définie sur Q 
et à valeurs dans F) est dérivable en A E Ü, 
s’il existe une fonction continue affine : 

M •—/(A) + L[ÂM] 


96 


CALCUL INFINITÉSIMAL 


(où L est une application linéaire continue 
de E dans F, c’est-à-dire un élément de 
é/(E,F) qui est tangente à/au point A). L 
s’appelle aujourd’hui la dérivée de / au 
point A (dans l’ancienne terminologie, 
c’était la « différentielle au sens de Stolz- 
Fréchet » ou plus brièvement la 
différentielle de / au point A). On la note 
d’ordinaire D l /(A). Lorsque /est dériva- 
ble en tout point de O, la fonction dérivée 
est l'application A »— ► D/(A) définie dans 
Q et à valeurs dans é/(E,F). On dit que / 
est continûment dérivable (ou encore de 
classe C 1 ) si la fonction dérivée est conti- 
nue, lorsqu’on munit V(E,F) de sa norme 
usuelle : 


il L || = sup || L(x) ||. 

J* U i 

Dans le cas particulier où E = R" et 
F = R, toute fonction de classe C 1 admet 
des dérivées partielles continues et la 
dérivée de / au point de coordonnées 
(.X|, A" 2 , .*„) est la forme linéaire qui 

associe au vecteur de coordonnées 
{dx x , dx 2 * dx n ) le nombre : 

(■*!» x 2* -, x n ) dx l + ÿ- (x, x n ) dx 2 

V X ] V X 2 

+ ... + ~-{x i ,... f x n )dx n ; 

la dérivée coïncide donc avec la « diffé- 
rentielle totale » d’Euler (cf. chap. 1 ). 

Lorsque E = R" et F = R /? la fonction 
/ est définie par p fonctions numériques /, 
/ 2 ,..., f jr La dérivée de / en un point de 
coordonnées (x {1 _y 2 , x n ) est, lorsqu’elle 
existe, l’application linéaire appartenant à 
:/(R”, R 77 ) définie par la matrice jaco- 
bienne des fonctions/ (j < p) par rapport 
aux variables v, (i < n). 

Une fonction qui possède des déri- 
vées partielles en chaque point de Q 
n’est pas nécessairement dérivable, 


comme le montre l’exemple de la fonction 
scalaire : 


f(x,y) = 


xy 

y/x 2 + y 2 


(prolongée par / (0, 0) — 0). Son graphe est 
un demi-cône dont le sommet est à l’ori- 
gine ; il ne possède donc pas de plan tangent 
en ce point. Par contre, on montre que 
toute fonction qui admet des dérivées par- 
tielles continues par rapport à l’ensemble 
des variables est nécessairement dérivable. 


Dérivées successives 

Supposons que la fonction dérivée 
M * D 1 / (M) soit elle-même dérivable : 
sa dérivée D 1 (D*/)(M) appartient à 
i/[ E, :/(E,F)]. On peut l’identifier à une 
application bilinéaire continue de E X E 
dans F, et dans ce cas on l’appelle la 
dérivée seconde de /au point M et on la 
note D 2 /'(M). On peut ainsi définir les 
dérivées successives de proche en proche. 

On peut également donner une défini- 
tion directe des fonctions r fois continû- 
ment dérivables (ou de classe CO en 
utilisant la notion de polynôme défini sur E 
et à valeurs dans F. Désignons par 
y k (E,F) l’espace vectoriel des applications 
continues ^-linéaires, symétriques, définies 
sur (E) A et à valeurs dans F. En d’autres 
termes L 4 . G L/ k { E, F) est une application : 

(V lf V 2f ...,V*)-L Jt [V 1 ,V 2( ... f V*] 

séparément linéaire par rapport à chaque 
argument, invariante lorsqu’on permute 
arbitrairement les vecteurs V, entre eux, et 
telle que || L k [V^, v/ ..., VJ || F reste borné 
lorsque les vecteurs V ; - restent tous dans la 
boule unité de E. Un monôme de degré k 
défini dans E et à valeurs dans F est alors 
par définition une fonction de point : 

M^L k [ÔM, ÔM, ..., ÔM] ; 
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remarquons que lorsque E est de dimen- 
sion finie et que Ton exprime OM à l’aide 
de ses composantes, on n’obtient pas un 
monôme ordinaire, mais un polynôme 
homogène de degré k ayant pour coeffi- 
cients des vecteurs de F. Un polynôme 
sur E et à valeurs dans F est maintenant, 
par définition, une somme finie de monô- 
mes. 

Une formule de Taylo r permet de 
remplacer les vecteurs OM qui intervien- 
nent dans la d éfinition précédente par des 
vecteurs AM où A E E. On dira qu’une 
fonction / définie sur O, admet un déve- 
loppement limité d'ordre m au point A, s’il 
existe des L k E é/ k (E, F), k = 1,2, n, 
tels que le polynôme : 

Ta/(B) =/(A) + jr 4 [AB, AB, .... AB] 

k = 1 


s’exprime ici par : 



i> + ’/CXKXB, xb, XB, dX) 
m fois 


où l’intégrale curviligne est prise le long de 
n’importe quelle courbe rectifiable joi- 
gnant A à B dans Q. 

L’expression (2), appelée reste intégral 
de la formule de Taylor, donne la valeur 
exacte de /(B) — T^B). On utilise aussi 
diverses majorations de ce reste. Si la 
dérivée A — ► D'^f est une fonction unifor- 
mément continue dans O, on peut majorer 
le reste par une expression de la forme : 


Il AB II" 


(Il AB ||), 


où co (x) est une fonction continue qui tend 
vers 0, lorsque x tend vers 0 ( majoration de 
Young). 


satisfasse à la condition : 

(1) ||/(B)-T a /(B)|| f < "AJpcudÀBl), 

où la fonction o A tend vers 0 lorsque 
|| AB || tend vers 0. 

Si un tel « polynôme de Taylor » existe 
en tout point A E Q, si les « coefficients » 
k !L* (que l’on note plutôt D Â /(A) et que 
l’on appelle les dérivées k-ièmes de f) 
varient continûment sur Q, et s’il existe en 
chaque point A E Q une fonction o A 
satisfaisant à la condition (1) on dit que / 
est de classe C'" dans Q (ou encore m fois 
continûment dérivable). Il est possible 
alors de transposer au cas des fonctions 
définies sur Q la plupart des formules à une 
variable. Par exemple, si / est de classe 
C m+l , le reste de son développement 
d’ordre m, qui s’écrit, dans le cas d’une 
variable : 


Le théorème des fonctions implicites 
et ses variantes 

Étant donné deux domaines Q C E (resp. 
O j C E]), rappelons qu’une application / 
de Q sur Qj est un homéomorphisme si/est 
bijective, continue ainsi que l’application 
réciproque f~K Un homéomorphisme 
peut être de classe C"' mais on dit que c’est 
un difféomorphisme (de classe C m ) si 
l’application réciproque / 1 est également 
de classe C m (et l’on montre qu’il suffit 
pour cela que f 1 soit de classe C 1 ). 
L’exemple de l’application t »— ► / de R sur 
R montre qu’un homéomorphisme de 
classe C 1 n’est pas nécessairement un 
difféomorphisme. 

Théorème d’inversion locale . E et F étant 
deux espaces de Banach (c’est-à-dire des 
espaces normés complets ), soit f une appli- 
cation de classe C"' définie dans un voisi- 
nage du point A E E et prenant ses valeurs 
dans F. Si la dérivée D /(A) est un 
isomorphisme linéaire de E sur F, alors il 
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existe un voisinage U de A dans E et un 
voisinage \J { de /(A) dans F, tel que la 
restriction de / à U soit un difféomor- 
phisme sur Uj. 

Commentons cet énoncé. Une fonction 
différentiable /est « approximativement » 
égale au voisinage de A à sa dérivée 
D‘/(A). Le théorème précédent exprime 
que si l’application linéaire tangente en A 
est inversible alors / est lui-même inversible 
au voisinage de A. Ainsi le comportement 
de la dérivée en un point conditionne le 
comportement local de / dans tout un 
voisinage de A. 

Le théorème précédent s’applique, par 
exemple, à l’application de R 2 dans R 2 
définie par X — e x cos v, Y — e x sin y 
(inspirée par l’application z • * e z de C dans 
C). On notera que cette application n’est 
pas globalement bijective. 

Théorèmes de submersion et d'immer- 
sion locale. Si l’un au moins des espaces de 
Banach E et F est de dimension finie, soit 
/ une application de classe C'”, définie dans 
un voisinage de A G E. Si la dérivée D/(A) 
est surjective (resp. injective ), alors il existe 
un voisinage U de A dans E et un voisinage 
U[ de /(A) dans F, et enfin un difféomor- 
phisme 0 de U sur U (resp. un difféomor- 
phisme 0 j de U { sur U tel que/ o 0 (resp. 
0j o f) soit la restriction à U d’une appli- 
cation linéaire surjective (resp. injective) 
de E dans F. 

Ces théorèmes signifient que, si une 
application / est « approximativement » 
une application linéaire surjective (resp. 
injective), on peut la transmuer en une 
application linéaire du même type. La 
restriction sur la dimension finie d’un des 
espaces n’est pas indispensable, mais il faut 
ajouter une hypothèse supplémentaire 
pour que les énoncés précédents restent 
valables. 


Forme archaïque du théorème de sub- 
mersion locale (théorème des fonctions 
implicites j. Si p fonctions : 

fj&u x 2 , ..., x„_ p , y u y 2 , y p ) 

(où j — 1,2, ..., p) sont de classe C" et si 
le déterminant jacobien des fonctions/ par 
rapport aux variables v) ne s’annule pas à 
l’origine, on peut exprimer localement les 
y'i comme fonctions de classe C'" des 
variables X = (x { , x 2 , x„_. p ) de façon à 

satisfaire au système d’équations « impli- 
cites » : 

f j [X,y l (X),y 2 (X), ...,y p (X)] = 0 

(où j = 1, 2, ..., p). 

Il existe une autre variante de ces 
théorèmes, appelée théorème du rang cons- 
tant , relative au cas où la dérivée de 
l’application / garde un rang constant au 
voisinage de l’origine. 

Les « images » et « noyaux » des appli- 
cations différentiables satisfaisant aux 
énoncés précédents sont localement des 
morceaux de « variétés différentiables », 
qui devront être convenablement recollés 
pour aboutir à une théorie globale. 

Un théorème beaucoup plus fin, 
démontré par J. Nash (1956), concerne le 
cas où Dj/i sans être surjective, a une 
image partout dense dans l’espace de 
Banach F, de dimension infinie. Dans ces 
conditions, la résolution locale du système 
d’équations implicites ne peut s’obtenir 
qu’au prix d’une certaine perte de dériva- 
bilité. 

3. La théorie fine contemporaine 

L'œuvre de H. Whitney 

Le mathématicien américain Hassler Whit- 
ney, dont la contribution à des branches 
très variées des mathématiques a été sou- 
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vent décisive (théorie des graphes, topo- 
logie algébrique et différentielle, axioma- 
tisation de la notion de variété ou de 
produit tensoriel, étude des ensembles 
analytiques réels, etc.), est le véritable 
initiateur du renouveau du calcul différen- 
tiel des fonctions de plusieurs variables. 
Parmi ses contributions, citons : 

Le théorème du prolongement (1934). 
En chaque point d’un ensemble fermé F 
quelconque de R" on se donne un poly- 
nôme à n variables de degré inférieur ou 
égal à m . Whitney énonce une condition 
nécessaire et suffisante pour qu’un tel 
champ de polynômes soit la restriction à F 
du champ des polynômes de Taylor d’une 
fonction / de classe C m . Ce théorème 
permet, en particulier, de construire des 
fonctions / de classe C m ayant certaines 
singularités données à l’avance : on com- 
mence par se donner l’ensemble F des 
points singuliers puis l’on cherche à pro- 
longer un champ de polynômes défini sur 
F. Indiquons que ce théorème est encore 
valable pour m = oo. Un cas particulier 
très important est celui où F se réduit à un 
seul point ; on obtient le théorème 
dE. Borel généralisé à n variables : « Il 
existe une fonction /de classe C 00 dont les 
dérivées partielles prennent en un point 
donné des valeurs arbitrairement choi- 
sies. » En d’autres termes, la série de 
Taylor d'une fonction de classe C°° peut 
être n’importe quelle série formelle. 

Caractérisation des idéaux fermés de 
fonctions différentiables. L’ensemble des 
fonctions numériques de classe C m définies 
sur un pavé compact K constitue une 
algèbre de Banach (lorsque m est fini) pour 
la norme de la convergence uniforme 
d'ordre m (c’est-à-dire de la convergence 
uniforme de chacune des dérivées partiel- 
les). La structure des idéaux de cette 
algèbre est d'une grande complexité, mais 


H. Whitney a démontré, en 1944, le 
théorème suivant concernant les idéaux 
fermés. 

Théorème. Pourqu’une fonction / de 
classe C m sur K appartienne à un idéal 
fermé 0, il faut et il suffit qu’à chaque point 
de K on puisse associer une fonction 
g A (E D telle que / et g A aient les mêmes 
polynômes de Taylor en A. Ce théorème 
signifie que l’appartenance ponctuelle à 3 
implique l’appartenance globale. 

Classification des singularités 

En 1925, le mathématicien américain 
Marston Morse a inauguré l’étude des 
singularités des fonctions de classe C m en 
montrant que l’on pouvait approcher toute 
fonction numérique / de classe C m à n 
variables par des fonctions dont les seuls 
points singuliers sont des points isolés 
critiques (c’est-à-dire dont la dérivée 
s’annule) dont la dérivée seconde est une 
forme bilinéaire associée à une forme 
quadratique non dégénérée. Il montra en 
outre qu’il était possible de transmuer un 
tel point singulier, à l’aide d’un difféomor- 
phisme local, en une fonction qui est une 
somme algébrique des carrés des coordon- 
nées. 

Ainsi, on abandonne l’étude inextrica- 
ble de toutes les singularités possibles pour 
ne s’intéresser qu’à des singularités géné- 
riques auxquelles on peut toujours se 
ramener grâce à une approximation et à 
une transmutation. 

En 1955, H. Whitney résoud la même 
question concernant les applications du 
plan R 2 sur le plan R 2 . Il met en évidence 
deux singularités génériques : le pli qui se 
ramène au modèle (y, y) (x 2 ,y) et la 

fronce dont le modèle est (x,y) ► (.y 3 — 

3 x y, y). Dans ces travaux, un rôle essen- 
tiel est joué par le théorème d’A. Sard 
( 1 942), dont le cas particulier simple relatif 
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aux fonctions C°° avait déjà été démontré 
par Morse : 

Théorème . Étant donné une application 
de classe C m de R" dans R p la mesure au 
sens de Lebesgue de l’image des points 
singuliers est nulle lorsque m ^ n — p -j- 1 
(Whitney a construit un exemple montrant 
que cette inégalité est nécessaire). 

Utilisant ce résultat, R. Thom a démon- 
tré un théorème de transversalité qui, géné- 
ralisant la méthode de Morse, indique dans 
quelle condition une application / de R" 
dans K p peut être approchée par des 
fonctions n’ayant que des singularités 
dûment cataloguées. 

Les cas p=2n~\~ 1, p=2n et p=2n—\, 
entièrement élucidés par Whitney, consti- 
tuent son célèbre théorème du plongement 
selon lequel toute variété différentiable à n 
dimensions abstraite, peut être réalisée 
comme sous-ensemble d’un espace R 2 ". 
On peut même se contenter d’un espace 
R 2/Î_I si l’on accepte de laisser subsister des 
« self-intersection ». Par exemple, la « bou- 
teille de Klein » peut être réalisée dans R 3 
à condition de se traverser elle-même, et 
dans R 4 sans aucun point double. 

Elude des idéaux 
de fonctions différentiables 

À la suite du théorème de H. Whitney, déjà 
cité, S. Lojasiewicz a démontré en 1959 
que tout idéal engendré dans l’algèbre des 
fonctions C* par une fonction analytique 
réelle est nécessairement fermé. 

Ce théorème signifie qu’une fonction / 
de classe C 00 est divisible par une fonction 
analytique g, si la division « ponctuelle » 
des séries formelles de Taylor en chaque 
point du domaine de /et g est possible. 

En 1962, B. Malgrange est parvenu à 
démontrer que le théorème de préparation 
de Weierstrass, classique dans le cas des 
fonctions analytiques de plusieurs varia- 


bles (cf. FONCTIONS ANALYTIQUES) reste 
valable pour les fonctions C x . 

Il s’agit d’une division avec reste (ana- 
logue à la division euclidienne) : il est 
possible de diviser au voisinage de l’origine 
une fonction C 00 de n + 1 variables 
(>\ X) = (y, x t , x 2 , x„) par un poly- 
nôme : 

y k + £ «,(X)r. 

/ < k 

Ici les üj sont des fonctions C x qui 
s’annulent pour X = 0, avec un reste qui 
est un polynôme de degré inférieur à k en 
y, dont les coefficients sont C 00 en X. 

Dans le cas analytique, on sait qu’une 
telle division s’effectue de façon unique. Il 
n’en est plus de même dans le cas C x , ce 
qui fait la difficulté du théorème de Mal- 
grange. 
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COMBINATOIRE analyse 


L J analyse combinatoire est l'ensemble 
des techniques qui servent, en mathé- 
matiques, à compter (ou dénombrer ) cer- 
taines structures finies , ou à les énumérer 
(établir des listes exhaustives de structures 
considérées), enfin à démontrer leur exis- 
tence pour certaines valeurs des paramè- 
tres dont elles dépendent. Ces structures 
sont très variées ; leur seul trait commun 
c’est d’être finies . En revanche, les problè- 
mes qu’on se pose sur ces structures sont 
très divers, et les techniques mathémati- 
ques qu’on utilise pour résoudre ces pro- 
blèmes, très différentes. Par exemple, si on 
veut dénombrer les arbres de n sommets, 
on établit une correspondance biunivoque 
entre l’ensemble de ces arbres et l’ensem- 
ble de certaines suites qu’on sait compter. 
Mais, si l’on veut démontrer l’existence 
d'une famille infinie de codes correcteurs, 
on utilise des résultats fins sur les anneaux 
de polynômes à coefficients dans un corps 
fini. Pourtant, dans les deux cas, on dit 
qu’on s’occupe d’analyse combinatoire. 
Dans le foisonnement des sujets dits de 
nature combinatoire, on a donc dû faire un 
choix et laisser de côté des objets impor- 
tants. 


1. Dénombrements élémentaires 

Dans les opérations élémentaires de 
dénombrement, on utilise un langage très 
proche du réel. On parle de choisir un objet 
de m façons différentes , on dit qu’il n’y a 
qu’un nombre n de possibilités... Considé- 
rons ainsi l’exemple suivant. Une urne 
contient 10 boules numérotées de 1 à 10 ; 
on tire successivement deux boules de 
l’urne sans remettre la première après 
tirage. Combien y a-t-il de tirages crois- 
sants , c’est-à-dire de façons de tirer deux 
boules dont les numéros vont en crois- 
sant ? Pour déterminer ce nombre, on 
raisonne de la façon suivante. Si la pre- 
mière boule a été tirée et que son numéro 
est / (1 ^ i < 10), pour obtenir un tirage 
croissant, on peut choisir le numéro j de la 
seconde de 10 — / façons différentes. 
Enfin, pour obtenir un tirage croissant, on 
peut choisir soit un tirage commençant par 
le numéro 1, soit un tirage commençant 
par 2, etc. Le nombre de tirages croissants 
est alors égal à ( 10 — 1) + ( 10 — 2) + ... 
+ (10 -9) + (10 -10) = 45. On a 
implicitement utilisé les deux règles sui- 
vantes (la seconde avant la première) : 

Règle de la somme : Si on peut choisir 
un objet a de m façons et un objet b de n 
façons, on peut choisir a ou h de m + n 
façons. 

- Règle du produit : Si on peut choisir un 
objet a de m façons, puis un objet b de n 
façons, on peut choisir a puis />, dans cet 
ordre , de mn façons. 

Reprenons l’exemple ci-dessus. Pour 
caractériser un tirage, il suffit de se donner 
un couple (/, j) d’entiers tels que / et j soient 
compris entre 1 et 10. Désignons par X 
l’ensemble des couples (/,/) tels que 
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1 ^ / < j < 10. Les tirages croissants cor- 
respondent aux éléments de X et, pour 
trouver le nombre de tirages croissants, il 
suffit de dénombrer l’ensemble X, c’est-à- 
dire de compter le nombre de ses éléments. 
Pour 1 < ^ 10, notons X h l’ensemble 

des couples (/, /) de X tels que i = h ; ainsi 
X h est le produit cartésien des ensembles 
[h] et {// + 1, A + 2, 10}. De plus, les 

ensembles X h sont disjoints deux à deux et 
leur réunion est X. Désignons par | X h | le 
nombre des éléments de X h ; alors en 
posant k— 10, le nombre, noté |X| des 
éléments de X est donné par : 

(1) I X | = | Xj | + | X 2 1 + ... 4- | Xftl . 

De plus, pour 1 < h ^ 10, on a : 

(2) |X*| = |{A}|.|{A + 1,A + 2,..., 10}| 

= 1.(10 — h) = 10 — h. 

En appliquant les formules ( 1 ) et (2), on 
retrouve bien 45 pour le nombre des élé- 
ments de X. Dans cette dernière démarche, 
nous avons résolument adopté le langage 
de la théorie des ensembles et utilisé cer- 
tains résultats sur les ensembles finis. 
D’abord comment caractérise-t-on les 
ensembles finis ? En premier lieu, on définit 
une numérotation d’un ensemble X comme 
une suite .y,, x 2 , ..., x n d’éléments de X telle 
K,- ^ Xj pour i j et telle que tout élément 
de X soit l’un des x r Les ensembles finis 
sont ceux qui possèdent une numérotation. 
L’entier n qui apparaît dans une numéro- 
tation d’un ensemble fini X s’appelle le 
cardinal de X ou le nombre d’éléments de X 
et se note | X |. Cet entier ne dépend pas en 
effet de la numérotation choisie. On 
convient que | 0 | = 0. On obtient alors : 
- Formule de la somme : Si X et Y sont 
deux ensembles finis, disjoints , l’ensemble 
X U Y est fini et l’on a : 

(3) |XUY| = |X| + |Y|. 


- Formule du produit : Si X et Y sont deux 
ensembles finis, le produit cartésien 
X X Y de X par Y est fini et l’on a : 

(4) |X X Y| = i X | . | Y | . 

Ces deux formules se démontrent de 
la même façon. On détermine une 
numérotation de X U Y et de X X Y, 
supposant données des numérotations 
de X et de Y et on vérifie les formules (3) 
et (4). 

Ces formules ont été utilisées, de façon 
explicite, dans l’exemple, en (1) et (2). Elles 
sont la traduction dans le langage de la 
théorie des ensembles des règles de la 
somme et du produit. On ne parle plus de 
« choisir un objet a de m façons », mais on 
considère l’ensemble X des choix possibles 
pour a et l’on suppose que l’on a | X | = m. 
Cette transcription nous permettra dans la 
suite d’utiliser indifféremment les deux 
langages. Lorsque les ensembles X et Y 
sont des ensembles finis quelconques, on 
peut exprimer les ensembles X U Y et Y 
comme des réunions de deux ensembles 
disjoints, à savoir : 

XUY = XU(YDCX) 
et Y = (X n Y) U (Y n C X). 

En appliquant la formule de la somme 
dans les deux cas, on obtient : 

(5) |XUY| = |X|-f | Y | — |XDY|. 

Rappelons enfin un principe fondamen- 
tal dans le dénombrement : 

(6) Pour que deux ensembles finis X 
et Y aient le même cardinal, il faut et 
il suffit qu’il existe une bijection de X sur 
Y. 

Dans de nombreux cas, la difficulté sera 
effectivement de construire une telle bijec- 
tion. Examinons maintenant quelques 
dénombrements fondamentaux. 
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D’abord les trois formules (3), (4) et (5) 
s’étendent au cas général de k ensembles 
{k ^ 2). On obtient : 

(7) | X 1 U X 2 U ... U X* | 

= | X, I + I X 2 1 + ... + I X* I , 

si X,- H Xj — 0, pour i =£ / 

De même, on a toujours : 

(8) | X, x X 2 x ... x X* | 

== I Xi | . | x 2 1 ... | X* | . 

Quant à la formule (5), sa généralisation 
est la suivante : 

(9) | Xj U X 2 U ... U X k | 

|x,| — |x,,nx,.j + ... 

< h 

+ (_ iy ~' X 1 Xi ' n X,! n - n + - 

il < ii < ... < /, 

+ (— i)*-» | x, n x 2 n ... n x* | . 

La formule (9) peut s’établir aisément 
par récurrence sur k. On l’appelle la for- 
mule du principe d'inclusion et d'exclusion . 
Elle a reçu de nombreuses applications. 

Si, dans la formule (8), on prend tous les 
ensembles X, égaux au même ensemble X, 
on a alors : 

(10) ] X* | — | X | *. 

Ainsi, l’ensemble X k de tous les &-uples 
(x,, x 2 , x k ), où les Xj sont pris dans X, a 
pour cardinal |X|*. Dans la littérature 
classique, si | X | = w, un Æ-uple 
( x j , x 2 , .... x k ) était appelé arrangement 
avec répétition de n objets pris k à k. 

Soit maintenant y\,y 2 , y k une numé- 
rotation d’un ensemble fini Y. Pour définir 
une application/de Y dans X, il suffit de se 
donner arbitrairement des éléments 
A'!, x 2 , x k (non nécessairement distincts) 
de X et de poser f(y,) = a,- pour 


1 < z < k. On définit ainsi une bijection de 
l’ensemble X k des &-uples (x,, x 2 , x k ) 
pris dans X sur l’ensemble, noté X Y , de 
toutes les applications de Y dans X. La 
formule (10) et le principe (6) impliquent 
donc : 

(11) |X Y | = |X||Y|. 

D’autre part, l’application qui fait cor- 
respondre à toute partie A de X sa fonction 
caractéristique cp A est une bijection de l’en- 
semble, noté If (X), de toutes les parties de 
X sur l’ensemble {0, 1} X des applications 
de X dans {0, 1}. La formule précédente 
implique alors | îT(X) | = | {0, 1 } | ' x l = 2 x l 
Soit 

(12) | 3*(X) | — 21 x I . 

Dénombrement des injections 

Considérons deux ensembles finis X et Y 
avec | X | = «, | Y | = p et n ^ p. Soit 3 
l'ensemble des injections de X dans Y, c’est- 
à-dire des applications / de X dans Y telles 
que les relations a, a' GX,a^ a' entraî- 
nent / (a) ^ f(xj . Il est clair que | 3 | ne 
dépend que de p et de n ; posons 
| 3 | = A (p, n ). Prenons un ensemble X' dis- 
joint de X avec \ X' \ = p — n. L’ensemble 
X" = X U X' a ainsi p éléments. Pour 
définir une bijection de X" sur Y, il suffit 
de se donner une injection / de X dans Y et 
une bijection g de X' sur Y — / (X). On 
peut choisir / de A (p, n) façons, puis 
g de A (p — n,p — n) façons. La règle 
du produit permet ainsi d’écrire : 
A (p, p) — A (p, n) A (p — n, p — n), où 
0 ^ n ^ p. Comme on a : A (p, 1) = p et 
A(/;, 0) = 1 (en convenant qu’il y a une 
application d’un ensemble vide dans tout 
ensemble), il vient : A (p, p) = pA(p — 1 , 
p— 1). D’où A {p,p)—p\, en posant 
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0 ! = 1 et p ! — p((p — 1 ) !) pour p > 1 . 
On a enfin : 

(13) A {p , n) = p \/(p — n)\ 

= p(p — 1) ... {p — n + 1). 

Soit X j, a 2 , x„ une numérotation don- 
née de X ; pour définir une injection / de 
X dans Y, il suffit encore de se donner 
arbitrairement une suite de n éléments (y l9 
y 2 , y„) de Y tous distincts et de poser 
/ (je/) = y,- pour 1 ^ ^ n. On trouve ainsi 

que le nombre de w-uples (y l9 y 2 , ..., >’„), où 
les y, sont des éléments tous distincts, 
pris dans un ensemble Y de cardinal p , est 
égal à pl/ip — n)\. Dans les ouvrages 
classiques, un tel /7-uple est appelé arran- 
gement sans répétition de p objets pris n 
à n . 

Si on prend Y = X, la formule (13) 
implique que le nombre de bijections de X 
sur lui-même - on dit aussi permutations de 
X - est égal à n !. 

Soit C n p le nombre de parties de Y qui 
ont n éléments. Pour définir une injection 
de X dans Y, il suffit de se donner une 
partie A de Y ayant n éléments, puis une 
bijection / de X sur A. On peut choisir A 
de C” façons, puis / de n ! façons. On a 
donc | £ | = Cp n !. D’où C" = A (p, n)/ 
n ! — p \/(n \(p — n) !). Les nombres C" 
sont les coefficients binomiaux : C" est aussi 
noté fréquemment : (J). Ce sont eux qui 
apparaissent dans la formule dite du 
binôme : 

p 

<X + v V ss \ C" x n vP n . 

V ' ' " Z-, ' ’ 

n = 0 

valable dans tout anneau commutatif. 
Notons que Ton a : Cjj = C p p — 1, C -J, = p, 
C” = Cf-”. On vérifie également la pro- 
priété Cp — C n p _ x + C” — J, qui permet de 
les déterminer de proche en proche. Le 
coefficient C n p est aussi le nombre des 


combinaisons de p éléments pris nù n, mais 
on tend à abandonner cette terminologie, 
une combinaison n’étant qu’un sous- 
ensemble A, de cardinal n , d’un ensemble 
Y de cardinal p. 

Dénombrement des applications 
croissantes de X dans Y 

Supposons que l’on prenne les ensembles 
X= {1,2 et Y= {1,2, où 
les entiers n et p sont quelconques. Une 
application / de X dans Y est dite croissante 
si l’on a /(/) < /(/) pour tout couple (/, j) 
tel que 1 < / < j < n. Par un raisonne- 
ment déjà utilisé plus haut, on vérifie que 
l’ensemble T de toutes les applications 
croissantes de X dans Y a même cardinal 
que l’ensemble T' des suites croissantes (y'j, 
y 2 , y„) de n termes pris dans Y, 

c’est-à-dire qui satisfont à y } < y 2 < ... 
< y n . Une telle suite est encore appelée 
combinaison avec répétition de p objets pris 
n à n. h son tour, V a même cardinal que 
l’ensemble F" des suites (z u z 2 , z n ) de 
n termes où les Zj sont pris dans l’ensemble 
{1, 2, 1 } et satisfont à 
Z\ < -? < ... < z n . On établit en effet une 
bijection de F sur F' en faisant corres- 
pondre à la suite de F la 

suite (y 7 ! H - 0, y 2 -f- 1, y n -j- n — 1). On 
a ainsi | T | = | f ’ | = q+„_,. 

Dénombrement des surjections 

Soit X et Y deux ensembles finis, respec- 
tivement de cardinal n et p. Désignons par 
S l’ensemble des surjections de X sur Y, 
c’est-à-dire des applications /de X dans Y, 
telles que pour tout y E Y, il existe un 
x E X satisfaisant à f(x) = y. L’ensemble 
S est vide si n < p. Supposons désormais 
que l’on a n ^ p. On ne connaît pas de 
formule explicite donnant le cardinal de S 
en fonction de n et p. Toutefois, il existe 
une formule de récurrence, qui permet de 
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le calculer de proche en proche. On appelle 
d’abord partition de l’ensemble X la don- 
née de r sous-ensembles A h A 2 , A r 
( r > 0) de X (dont certains peuvent être 
vides) satisfaisant à A, H A ■ = 0 si / ^ j 
et X = A, U A 2 U ... U A,.. Notons que 
pour définir une partition, on ne s’impose 
pas un ordre sur les A,. Désignons par SJ 
le nombre de partitions de X en p sous- 
ensembles non vides. Pour définir ensuite 
une surjection / de X sur Y, il suffit de 
se donner une partition de X en p 
sous-ensembles non vides, puis une bijec- 
tion de l’ensemble formé par ces p sous- 
ensembles, sur Y. D’après la règle du 
produit, on a | S \ = p ! SJ. Il est mainte- 
nant facile de vérifier que les nombres SJ 
satisfont aux relations de récurrence sui- 
vantes : 

si = s* = 1 et S£ + 1 = s^- 1 +p S£ 
pour 1 < p < n. 

Ces relations de récurrence permettent 
donc de calculer | S | de proche en proche. 
Les coefficients SJ s’appellent les nombres 
de Stirling (de deuxième espèce). Donnons 
le tableau des premiers coefficients SJ : 



II 

N> 

n = 1 

1 0 0 0 0 

2 

110 0 0 

3 

13 10 0 

4 

17 6 10 

5 

1 15 25 10 1 


Par exemple, le nombre de surjections 
d’un ensemble de 5 éléments sur un 
ensemble de 3 éléments est égal à 
3 ! S| = 150. 


2. Fonctions génératrices 

On a vu qu’on ne savait pas trouver de 
formule explicite donnant le nombre 
de surjections d’un ensemble de n élé- 


ments sur un ensemble de p éléments, mais 
on peut faire apparaître ces nombres 
comme coefficients d’une série. La fonc- 
tion de deux variables / (/, u) — exp (/(exp 
u — 1 )) se développe en série sous la 
forme : 


+ XS-2> 


t p \ 


P = 1 


le nombre de Stirling SJ apparaît, divisé 
par n !, comme coefficient du monôme 
u n t p . On dit que la fonction f(t , u) est 
la fonction génératrice des nombres 
SJ jn ! ; puisqu’on connaît l’expression de 
cette fonction génératrice, on pourra 
résoudre d’autres problèmes combinatoi- 
res ou trouver des fonctions génératrices 
d’autres nombres liés aux nombres de 
Stirling. 

Supposons donné un anneau A com- 
mutatif et ayant un élément unité. On 
appelle série formelle à coefficients dans A 
et en une indéterminée w, une somme 
symbolique infinie : 

n > 0 


où les a n sont dans A {n > 0). On dit que 
a n est le coefficient de u n dans cette série. 
La somme et le produit de deux séries 
formelles sont définis de manière à 
respecter les règles usuelles de distributi- 
vité pour le produit de deux séries infinies 
et le calcul sur les puissances u n u m — u n+m 
(cf. anneaux et algèbres, chap. 2) : si on 
a deux séries : 

^ a„u n et 

n > 0 n > 0 


leur somme est la série : 

^ (a„ -f b n )u n , 
0 
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et leur produit est donné par : 

n ^ 0 

où Ton a : c n = a 0 b n -h a x b n _ x +...+ a n b 0 
pour tout n ^ 0. Si U est une telle série 
sans terme constant, c’est-à-dire telle que le 
coefficient de u° soit nul, on appelle 
exponentielle de U la série : 

exp U = Vni. 

n > o 

En d’autres termes, exp U est la série 
formelle dont le coefficient de u n est le 
coefficient de u " dans la somme (finie) : 

1 + U/l ! + U 2 /2! + ... + UVn ! (n > 0). 

Une suite infinie d’indéterminées 
t = (q, ...) étant donnée, nous prenons 

pour anneau A l’anneau des polynômes à 
coefficients rationnels dont les indétermi- 
nées sont prises dans la suite t. Posons 
alors : 

U = y t„u n /nl; 

n > 1 


Le coefficient du monôme : 

dans a est donc égal à : 

= n \/{m i \m 2 \ ... m n \ 1 ! m i 2 ... n !'"»). 

On peut vérifier que ce nombre est le 
nombre de partitions de type (m h m 2 , ..., 
m n ), c’est-à-dire de partitions de l’ensemble 
X — {1,2, ..., n } en m x + m 2 -f- ... + m„ 
sous-ensembles non vides, parmi lesquels 
ni] sont de cardinal 1, m 2 de cardinal 2, ..., 
m„ de cardinal n. 

Cette interprétation nous permet de 
retrouver le nombre de partitions de 
l’ensemble X = {1, 2, n] en p sous- 
ensembles non vides. En effet, le nombre 
de sous-ensembles non vides d’une parti- 
tion de type (m l5 m 2 , m„) est 

p = Wj -J- m 2 + ... + m n . Si donc l’on 
pose t x = U = ... = t n = t dans l’expres- 
sion (1), le coefficient de t p dans le second 
membre va être égal au nombre de parti- 
tions de X en p sous-ensembles non vides, 
soit : 


son terme constant est nul, on peut donc 
prendre son exponentielle, qu’on peut 
écrire : 




n 



exp U = 1 + y a„u n /n !. 
oi 

Il est facile de voir que a n est un 
polynôme de degré n en les n variables q, 
r 2 , . t n , où n ^ 1 . Plus précisément, on a : 

(1) a n = a n (t h t z ,...,t n ) 

= (n !/(m J m 2 ! ... m„ !)) 

X (t x /\ !) m i (r 2 /2!)'*2 ... (i t„/n !)«-, 

où la sommation est étendue à toutes les 
suites (m h m 2 , ..., m„) de n entiers positifs 
satisfaisant à \m x + lm 2 + ... + nm„ = n. 


Par conséquent la fonction génératrice 
des nombres de Stirling de seconde espèce 
est donnée par : 

n 

< u n /n !) ^ S^tP. 

n > 1 p = 1 

= exp (r(exp u — 1)). 

Par exemple, pour trouver le nombre de 
surjections d’un ensemble de n éléments 
sur un ensemble de p éléments {p ^ n), on 
détermine le coefficient c de u n f dans le 
développement de exp (?(exp u — 1 )) et le 
nombre cherché est égal à n ! p ! c. 
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3. Construction 
de correspondances 

Dans la première partie, nous avons passé 
en revue tous les ensembles finis qu’il était 
aisé de dénombrer en faisant usage des 
deux règles de la somme et du produit. Ces 
techniques élémentaires s’appliquent plus 
difficilement lorsqu’on veut dénombrer 
d’autres structures finies plus élaborées 
comme celles des arbres ou certains types 
de graphes . Le plus souvent on est conduit 
à chercher une correspondance biunivo- 
que entre ces structures et les ensembles 
finis considérés dans la première partie. 
Jusqu’ici, il n’existe pas de théorie pour 
construire ces correspondances, tout est 
une question d’ingéniosité et de patience. 
À titre d’exemple, on peut décrire 
ci-dessous une telle correspondance entre 
les arbres de n sommets et les ( n — 2)-uples 
(x h x 2 , jc„_ 2 ), où les Xi sont des entiers 
compris entre 1 et n . 

Un graphe est la donnée d’un ensemble 
X - ses éléments sont les sommets du 
graphe - et d’une classe U de sous- 
ensembles de X à deux éléments, appelés 
arêtes. Si l’on a x, y E X et {a, y] E U, on 
dit que x et y sont adjacents. Une chaîne 
du graphe {X, U} est une suite {a'j, 
{a 2 ,> j 2 }, (*„,>’/?} d’arêtes distinctes telle 

que, lorsque n > 1, on ait : 

(*/» y A n Uz+i^z+tî ^ 0> 

pour i = 1,2, ..., n — 1. Si de plus, on a 
n > 1 et 

f X n ,y n ] n {.x u yd =7* 0, 

on dit que la chaîne est un cycle. Un graphe 
est dit connexe si. pour tout couple de 
sommets distincts (a\ y), il existe une 
chaîne {a,,j’|}, {a 2 ,js}, ..., {a #i ,j>„} telle 
que Aj — x et y n = y. Un arbre de n 
sommets est alors défini comme un graphe 


de n sommets qui est connexe et sans 
cycles. On a l’habitude de représenter un 
graphe fini de n sommets comme un 
ensemble de n points du plan numérotés de 
1 à n où les sommets i et j sont reliés entre 
eux si et seulement si l’on a {/,y} E U. 
Considérons par exemple le graphe de la 
figure ci-dessous. C’est un arbre de sept 
sommets, numérotés de 1 à 7. 

Soit A„ l’ensemble de tous les arbres 
possibles de n sommets numérotés 1,2,..., 
n. Cayley fut le premier à démontrer que 
l’on a | A„ | = n n ~ 2 . Or ce nombre est pré- 
cisément le cardinal de l’ensemble H„ de 
tous les (n — 2)-uples (x b x 2 , x„_ 2 ) où les 

Xi sont pris dans X = {1,2, ..., n] (formule 
( 1 1 ) de la première partie). Pour démontrer 
la formule | A„ j = n n ~ 2 , il suffit donc de 
construire une bijection <I> de A n sur H,,. 
Nous donnons ici la construction d’une 
telle correspondance due à Prüfer. Celle-ci 
fait usage des deux propriétés suivantes sur 
les arbres, faciles à vérifier. D’abord, un 
arbre a toujours (au moins) un sommet 
pendant , c’est-à-dire un sommet qui n’est 
adjacent qu’à un seul autre sommet. 


6 



Ensuite, si l’on « efface » un sommet pen- 
dant d’un arbre de n sommets, et l’arête qui 
le contient, on obtient un arbre de {n — 1) 
sommets. La construction de Prüfer est 
alors la suivante : pour un arbre de A„ 
donné, on efface le plus petit sommet pen- 
dant et l’on désigne par jtj l’unique sommet 
qui était adjacent à ce sommet pendant. On 
répète cette opération avec l’arbre restant 
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de (n — 1) sommets et Ton détermine x 2 et 
ainsi de suite. On s’arrête lorsqu’il ne reste 
plus que deux sommets (adjacents). Par 
exemple, à l’arbre de la figure ci-dessus on 
fait correspondre la suite (1,7, 1,7, 7). 
Les sommets pendants qu’on a successive- 
ment effacés sont 2, 3, 4, 1,5 et il est resté 
l’arbre formé par les deux sommets 6 et 7. 
On vérifie que l’application <f> de A„ sur H„ 
ainsi construite est bien bijective. D’où l’on 
déduit | A, , | = | H w | = n”~ 2 . 

4. Théorèmes d'existence 

Le théorème de Ramsey et celui de Hall- 
Konig, dont nous donnons les énoncés 
maintenant, jouent un rôle spécial en 
combinatoire. Ils assurent l’existence de 
certaines configurations dans des condi- 
tions très générales et ont ainsi trouvé de 
nombreuses applications. 

Supposons que l’on ait un graphe de six 
sommets, dans lequel deux sommets dis- 
tincts sont joints par une arête « coloriée » 
en bleu ou en rouge. Démontrons la 
propriété (P) suivante : Il existe un triangle 
dont les trois arêtes ont la même couleur. 
Considérons en effet les cinq arêtes issues 
d’un sommet donné Sj du graphe. Néces- 
sairement trois de ces arêtes ont la même 
couleur, disons bleue ; appelons-les SjS 2 , 
SjS 3 et S,S 4 . Si l’une des arêtes S 2 S 3 , S 2 S 4 , 
S 3 S 4 est bleue, disons S 2 S 3 , le triangle 
est bleu. Sinon les arêtes S 2 S 3 , S 2 S 4 , 
S 3 S 4 sont rouges, mais alors le triangle 
S 2 S 3 S 4 est rouge. La propriété (P) est ainsi 
vérifiée. L’argument essentiel qui a été 
utilisé est le principe des tiroirs : si l’on met 
n objets dans p tiroirs (p ^ n), alors le 
nombre des objets dans au moins un tiroir 
est supérieur ou égal à njp. Le théorème de 
Ramsey peut être considéré comme une 
généralisation de ce principe. 


Théorème de Ramsey . Soit X un ensem- 
ble de n éléments et supposons donnés 
d’abord trois entiers p , q , r satisfaisant à 
p > r, q > r et r > 1, ensuite une parti- 
tion de l’ensemble de toutes les parties de 
X de cardinal r, en deux classes (T et Q. 
Alors il existe un entier N(/?, q , r) ne 
dépendant que des entiers p , q , r et non pas 
de l’ensemble X tel que la propriété (P') 
suivante soit vérifiée : Si n > N(p, q , r), il 
existe ou bien une partie A de X de p 
éléments qui a tous ses sous-ensembles de 
cardinal r dans 3\ ou bien une partie B de 
q éléments qui a tous ses sous-ensembles de 
cardinal r dans Q. 

Dans l’exemple précédent, on avait 
n = 6,p = q = 3 et /* = 2. Les ensembles 
de deux éléments sont alors les arêtes, qui 
sont divisées en deux classes, les bleues 
(classe îT) et les rouges (classe &). La 
propriété (P) équivaut à dire que l’on a 
N(3, 3, 2) > 6. En fait, on a l’égalité. 

Le théorème de Hall-Konig peut être 
énoncé de deux façons différentes, soit en 
termes de systèmes de représentants dis- 
tincts, soit en termes de matrices à coef- 
ficients 0 ou 1. Nous ne donnerons pas ici 
l’énoncé sous cette dernière forme. Soit 
X — { 1, 2, 3, 4, 5} l’ensemble des cinq 
premiers entiers et considérons les sous- 
ensembles X] = {1,4}, X 2 = {1,2,4}, 
X 3 = {1, 2,4} et X 4 = {2, 4, 5} de X. On 
peut choisir des entiers xq, xr 2 , x 3 , x 4 de 
sorte que l’on ait x,G X,pour 1 ^ i < 4 et 
que tous les x,- soient distincts. Il suffit de 
prendre en effet les nombres x { — 1, 
x* 2 = 2, x 3 = 4, x 4 = 5. Si on remplace 
dans cet exemple X 4 par X 4 ' — (2, 4}, un 
tel choix n’est plus possible puisque la 
réunion des quatre ensembles 
X h X 2 , X 3 , X 4 ' ne contient que trois élé- 
ments distincts 1, 2, 4. On est ainsi amené 
à donner la définition suivante : Étant 
donné une suite (X b X 2 , ..., X„) de parties 
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d’un ensemble non vide X, on dit que cette 
suite possède un système de représentants 
distincts , s’il existe une suite (x b x 2 , 
de n éléments distincts de X satisfaisant à 
x -, E X y pour tout i tel que 1 < / < n. 

Théorème de Hall-Kônig. La condi- 
tion nécessaire et suffisante pour qu’une 
suite (X,, X 2 , X„) de parties d’un 
ensemble non vide X possède un sys- 
tème de représentants distincts est 
que, pour tout k (1 ^ k ^ n) et tout 
sous-ensemble {z ls i 2 , ...» /*} de k in- 
dices extrait de {1,2, ...,«} on ait 
I X/, U X/ 2 U ... U X it | > k. 

La condition nécessaire est tout à fait 
évidente, mais la condition suffisante est 
loin de l’être. 


5. Existence et construction 
de modèles 

Un certain nombre de modèles ont été tout 
particulièrement étudiés, c’est le cas des 
carrés latins , sans doute parce qu’un 
mathématicien célèbre comme Euler fit à 
leur sujet une conjecture malheureuse et 
qu’il fallut attendre 177 ans pour prouver 
son inexactitude. En introduisant des 
notions comme celle d’orthogonalité, on a 
pu établir des liens étroits entre les carrés 
latins et certaines géométries finies, ou 
encore avec d’autres modèles comme les 
blocs incomplets équilibrés , ce qui a permis 
souvent d’étudier le même objet avec des 
optiques différentes. 

Un carré latin d’ordre n est une matrice 
carrée A = (a ÿ ), j ^ ,■ ^ „ dont les coeffi- 
cients üjj sont 1,2, et dans laquelle 
chaque entier k apparaît une et une seule 
fois dans chaque ligne et chaque colonne 
(1 ^ k < n). Il existe naturellement un 
carré latin d’ordre n pour tout n ^ 1 . Par 
exemple, la table de multiplication d’un 


groupe fini d’ordre n est un carré latin. En 
fait, un carré latin peut être considéré 
comme la table de multiplication d’un 
système algébrique dont la loi est seule- 
ment supposée simplifiable. Soit l n le nom- 
bre de carrés latins d’ordre n ; jusqu’à ce 
jour, on a pu déterminer les valeurs exactes 
de l n pour 1 < n < 8. Pour calculer / 8 , on 
a dû recourir à l’usage d’ordinateurs, mais 
même avec ceux-ci, en l’absence de nou- 
velles méthodes, on ne peut espérer aller 
bien loin dans cette direction. En revanche, 
l’orthogonalité a permis de trouver des 
résultats plus intéressants. Soit A — (a if ) et 
B = (6, y), deux carrés latins d’ordre n ; on 
dit qu’ils sont orthogonaux si tous les n 2 
couples (a ij, b y), où ij — 1,2 sont 
distincts. Par exemple, les deux carrés 
latins d’ordre 4 indiqués ci-dessous sont 
orthogonaux : 


1 

2 

3 

a\ 


h 

2 

3 

4 \ 

2 

1 

4 

3 

B = 

3 

4 

1 

2 

3 

4 

1 

2 

4 

3 

2 

1 

\ 4 

3 

2 

V 


\ 2 

1 

4 

3 / 


Soit C la matrice ayant pour coefficients 
les couples bÿ) ; dans C tous les n 2 
couples (1, 1), (1, 2), ..., ( n , n) apparaissent 
une et une seule fois. Dans l’exemple 
ci-dessus, on obtient la matrice : 

1 1,1 2,2 3,3 4,4^ 

2.3 1,4 4,1 3,2 

3.4 4,3 1,2 2,1 

\4.2 3,1 2,4 1,3/ 

On dit parfois que C est un carré 
gréco-latin . On s’est alors posé le problème 
de savoir s’il existe une paire de carrés 
latins orthogonaux pour tout n. Avec un 
peu de patience, il est facile de construire 
de telles paires pour n = 3, 4 et 5 et même 
pour des entiers supérieurs à 6. C’est Euler 
qui en 1782 formula ce problème en termes 
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récréatifs. Supposons, en effet, que, dans 
six régiments donnés, on relève, dans 
chacun, six officiers, tous de grades diffé- 
rents, et qu’on veuille disposer ces trente- 
six officiers dans un carré de six cases de 
côté, de sorte que dans chaque ligne et 
dans chaque colonne il y ait un représen- 
tant de chaque régiment et un représentant 
de chaque grade. Une telle disposition 
est-elle possible ? La réponse est non, et ce 
n’est qu’en 1900 que Tarry démontra cette 
impossibilité par une analyse très systéma- 
tique de tous les cas possibles. Le problème 
des trente-six officiers était donc impossi- 
ble. Si l’on numérote de 1 à 6 les six 
régiments et les six grades, chacun des 
officiers peut être repéré par un couple 
(h A où 1 < ij < 6 ; le premier indice i 
désigne son régiment et le second j son 
grade. Vouloir un représentant de chaque 
régiment (resp. grade) dans chaque ligne et 
chaque colonne et vouloir quand même 
disposer les trente-six officiers, c’est cher- 
cher à satisfaire aux trois exigences : 

- Les premiers indices i forment un carré 
latin ; 

- Les seconds indices j forment un carré 
latin ; 

- Les deux carrés latins ainsi formés sont 
orthogonaux. 

L’impossibilité du problème des trente- 
six officiers démontrée par Tarry équivaut 
donc à l’impossibilité de construire deux 
carrés latins d’ordre 6 orthogonaux. Euler 
n’ayant pu réussir à construire de couples 
de carrés latins orthogonaux d’ordre n 
pour des entiers de la forme n = 4 k + 2, 
conjectura qu’il n’existait pas de couples 
de carrés latins orthogonaux d’ordre n 
pour tout n de la forme 4 k 2. À 
l’exception du seul cas n = 6, sa conjec- 
ture s’est révélée complètement erronée et, 
en 1959, Bose, Shrikhande et Parker 
démontrèrent qu’il existe en effet un cou- 


ple de carrés latins orthogonaux d’ordre n 
pour tout n différent de 2 et 6. Avant cette 
date, cependant, on savait construire un 
couple de carrés latins orthogonaux pour 
tout n non congru à 2 modulo 4. Une des 
méthodes qui s’est révélée des plus fécon- 
des a été de considérer pour tout n > 3, 
de la forme p'\ où p est un nombre premier 
et r > 0, le corps fini F„ ayant n éléments. 
Désignons par x a = 0, x x , les n 

éléments de F n et formons les matrices A b 
A 2 , A„_,, où A* = (jfiij) avec 

k a îp — x k x i +Xj(i, j = 0, 1, n - 1 ; 
k = 1, 2, ..., n— 1). Il est facile de vérifier 
que A j, A 2 , A„ , L sont des carrés latins 
orthogonaux deux à deux. On a pu étendre 
cette construction à tous les entiers n ^ 2 
modulo 4 et démontrer que si p/ 2 .../?/* 
est la décomposition d’un entier n en 
facteurs premiers (les p f étant tous distincts 
et les r, strictement positifs) et si / — min 
(y?/ 7 — 1) pour 1 < i < k est supérieur ou 
égal à 2, alors il existe t carrés latins d’ordre 
n orthogonaux deux à deux. 

Notons que pour n ^ 3, il est aisé de 
démontrer que le cardinal de tout ensem- 
ble de carrés latins orthogonaux deux à 
deux est au plus égal à (n — 1 ). Lorsque n 
est supérieur ou égal à 3 et de la forme p r 
où p est premier et r > 0, d’après ce qui 
précède, on peut construire un ensemble 
de carrés latins orthogonaux deux à deux 
qui soit de cardinal maxima, à savoir 
(n— 1). Qu’en est-il pour les autres 
entiers ? La question est loin d’être réso- 
lue. Le théorème de Bruck-Ryser démon- 
tré en 1949 et énoncé ci-dessous apporte 
un premier élément de réponse. Il affirme 
la non-existence de certaines configura- 
tions dites plans projectifs d'ordre «, pour 
une famille infinie d’entiers. Sans vouloir 
donner de nouvelles définitions, disons que 
l’existence d’un plan projectif d’ordre n est 
équivalente à l’existence d’un ensemble de 
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( n — 1) carrés latins d’ordre n orthogonaux 
deux à deux. 

Théorème de Bruck-Ryser. Si pour 
n = 1 ou 2 mod 4, il existe un nombre 
premier p de la forme 4 k + 3 et un entier 
r > 0 tels que p 2r ~ ] divise n et p 2r ne divise 
pas n, alors il n’existe pas de plan projectif 
d’ordre n. 

Il n’y a, par exemple, pas de plan 
projectif d’ordre 14 et par conséquent on 
ne peut trouver 13 carrés latins d’ordre 14 
orthogonaux deux à deux. 

Donnons pour terminer un bref aperçu 
sur les modèles dits en blocs incomplets 
équilibrés . Soit X un ensemble de v 
éléments x h x 2 x v et X h X 2 , X h 
des sous-ensembles, dits blocs, de X qui 
soient distincts. On dit que ces sous- 
ensembles forment un modèle en blocs 
incomplets équilibrés de paramètres 
(b, v, r, k , X), si les propriétés suivantes 
sont vérifiées : 

(I) | X,- 1 = k pour 1 < /' < b ; 

(II) tout Xj EX appartient à exactement r 
blocs (1 < / < v) ; 

(III) toute paire d’éléments de X apparaît 
dans X blocs. 

Les paramètres b , v, r, k et X ne sont pas 
indépendants. Il est aisé de vérifier les deux 
relations : 

(1) bk = vr et r(k — 1) — X(v — 1). 

Mais à leur tour, si b , v, r, A: et X satisfont 
aux relations (1), cela n’implique pas 
nécessairement qu’il existe un modèle 
en blocs incomplets équilibrés de paramè- 
tres ( b , v, r, k , X). Beaucoup de résultats 
partiels sont connus au sujet de la cons- 
truction de tels modèles. Lorsque b — v 
(donc k — r), on dit que le modèle est 
symétrique ; on l’appelle encore (v, k, X)- 
configuration et l’on montre qu’un plan 
projectif d’ordre n est équivalent à 


une (v, k, X)-configuration de paramètres 
v = n 2 -yn-\-\,k = n~y \ et X = 1 . 
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COMPLEXES NOMBRES 


I ntroduits à l’origine comme symboles 
purement formels destinés à rendre 
compte des propriétés des équations algé- 
briques, les nombres imaginaires sont d'un 
usage courant au xvm e siècle, mais ce n’est 
qu’au siècle suivant qu’ils seront définis et 
utilisés correctement, avec la rigueur qui 
caractérise les préoccupations des mathé- 
maticiens du xix e siècle. Et c’est alors le 
prodigieux essor de la théorie des fonctions 
d'une variable complexe et l’entrée en 
force des imaginaires dans presque tous les 
domaines des mathématiques. De nos 
jours, les nombres complexes intervien- 
nent de manière essentielle, comme un 
cadre naturel, dans maintes théories 
mathématiques et physiques. 
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1 . Historique 

Les nombres « impossibles » 

Alors que de nombreux mathématiciens 
(dont Viète) hésitaient encore à utiliser les 
nombres négatifs, les algébristes italiens du 
xvi e siècle, Cardan et ses élèves, s’enhar- 
dirent à introduire dans les calculs des 
symboles purement formels V— a, a > 0, 
représentant le résultat de l’extraction 
« impossible » de la racine carrée du nom- 
bre négatif — a ; ils décrivent en détail des 
règles de calcul permettant de manipuler 
ces nouveaux « nombres », appelés par eux 
nombres impossibles. 

À l’origine, il s’agissait seulement de 
donner des racines à toutes les équations 
du second degré ; les résultats obtenus 
dans l’étude de l'équation du troisième 
degré allaient familiariser les mathémati- 
ciens avec ces symboles et mettre en 
évidence leur rôle comme intermédiaire 
commode de calcul dans de nombreux cas. 
Au moyen de la formule dite de Cardan, 
Bombelli montre, en 1572, que la racine 
x = 4 de l’équation x 3 — 15 x H- 4 peut 
s’écrire : 

V 2 — + Vï+v=m = 4, 

mettant par là en évidence le fait que 
certaines quantités réelles peuvent être 
représentées par des expressions en appa- 
rence imaginaires. Ainsi, la formule de 
Cardan permet de représenter des racines 
réelles par l’intermédiaire d’opérations 
effectuées sur des nombres impossibles, ou 
« imaginaires ». Les nombres imaginaires 
fournissent donc des méthodes de calcul, 
de nature certes mystérieuse, mais qui 
permettent d’obtenir des résultats « vrais » 


qu'il serait souvent beaucoup plus long ou 
beaucoup plus difficile d’obtenir directe- 
ment. 

Pour ces raisons, somme toute empi- 
riques, les mathématiciens utilisèrent avec 
une confiance croissante les nombres 
imaginaires depuis le début du xvn e siècle. 
Dès 1629, A. Girard soupçonnait que 
toute équation de degré n a n racines 
réelles ou imaginaires, ce qui revenait à 
pressentir que les nombres imaginaires 
constituent le cadre « naturel » de la 
théorie des équations. À partir de 1675, 
Leibniz applique avec succès ses méthodes 
(de développements en série par exemple) 
aux nombres imaginaires et obtient ainsi 
de nombreux résultats, tandis qu’A. de 
Moivre, au début du xvm e siècle, met en 
évidence, par une utilisation systématique 
de la trigonométrie, les liens entre la 
recherche des racines des nombres ima- 
ginaires et la division d’un arc de circon- 
férence en parties égales. 

La possibilité, admise implicitement, 
d’étendre aux nombres complexes la plu- 
part des notions relatives aux nombres 
réels allait se trouver mise en question par 
la controverse des logarithmes des nombres 
complexes, dont l’intérêt était apparu, par 
analogie avec le cas des pôles réels, dans 
l’intégration des fractions rationnelles. Les 
différentes formules contradictoires obte- 
nues suscitèrent contre les imaginaires un 
vent de méfiance, qui fut dissipé par 
L. Euler ; celui-ci comprit qu’il fallait 
abandonner le caractère univoque du loga- 
rithme pour obtenir une théorie satisfai- 
sante et établit d’innombrables formules 
relatives aux fonctions élémentaires d’une 
variable complexe. 

À la fin du xvm e siècle, les imaginaires 
sont d’usage courant, mais leur « existence 
mathématique » véritable n’est pas éta- 
blie ; c’est aux mathématiciens du xix e siè- 
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de qu’il appartenait de les construire à 
partir des quantités connues, de leur don- 
ner une « réalité mathématique ». Avec 
Cauchy, c’est le prodigieux essor de la 
théorie des fonctions d’une variable com- 
plexe et le début de l’analyse contempo- 
raine (cf. FONCTIONS ANALYTIQUES). 

Théorie géométrique 

L’idée, non seulement de représenter les 
nombres imaginaires par les points du 
plan, exprimée maladroitement par Wallis 
dès 1685, mais de les définir à partir de ces 
notions, est apparue dans deux mémoires, 
passés inaperçus à l’époque, du Danois 
Wessel ( 1 798) et du Suisse Argand ( 1 806). 
En fait, c’est Cauchy qui diffusera ce point 
de vue. 

Dans le plan muni de deux axes de 
coordonnées Ox et Oy, on dira que les 
vecteurs d’origine O portés par Ox 
définissent les nombres réels, tandis que les 
autres vecteurs d’origine O définissent les 
nombres imaginaires ; le terme nombres 
complexes recouvre à la fois les nombres 
réels et les nombres imaginaires. 

L’addition des nombres complexes se 
définit à partir de l’addition usuelle des 
vecteurs. Pour la multiplication, on fait la 
construction suivante : soit OU le v ecteur 
unitaire de l’axe Ox ; le v ect eur O C « pro- 
duit » des vecteurs OA et O B s’obtient 
alors en construisant sur OA un triangle 
OAC directement semblable au triangle 
OUB (fig. 1). À partir de là, on retrouve 
géométriquement toutes les propriétés des 
nombres complexes. 

Le nombre complexe i est défini par le 
vecteur unitaire de l’ax e O y , et la multi- 
plication d'un vecteur OA par i revient 
donc à prendre un ve cteu r OA' directe- 
ment perpendiculaire à OA ; répétant cette 
opération, on obtient le vecteur OA" 



opposé du vecteur OA, c’est-à-dire que la 
multiplication par i 2 revient à multiplier 
par le nombre réel — 1 . 

Théorie arithmétique 

La théorie géométrique présente l’incon- 
vénient de subordonner toutes les proprié- 
tés algébriques des nombres complexes à 
des considérations géométriques qui peu- 
vent sembler étrangères. La théorie arith- 
métique, due à Hamilton (1835), consiste 
à considérer les nombres complexes 
comme des couples de nombres réels et à 
définir la somme et le produit par des 
formules explicites ; nous n’insisterons pas 
davantage ici sur cette approche, que nous 
exposerons ci-dessous. Ce point de vue 
conduit à essayer de définir plus généra- 
lement des opérations d’addition et de 
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multiplication pour des systèmes de n 
nombres réels et a conduit Hamilton à 
introduire les quaternions et plus généra- 
lement les algèbres de dimension finie 
(appelées, au xix e siècle, systèmes hyper- 
complexes ; cf. ANNEAUX ET ALGEBRES). 

Les équivalences algébriques 

Dès 1847, Cauchy considère que les calculs 
sur les nombres complexes reviennent à 
calculer sur les polynômes en la variable z, 
soumis aux règles usuelles de l’algèbre, en 
remplaçant i 2 + 1 par 0 ; cela revient à 
considérer que deux polynômes sont équi- 
valents, c’est-à-dire définissent le même 
nombre complexe, si leur différence est 
divisible par X 2 + 1 . Dans le langage 
contemporain, cela revient à définir 
l’ensemble des nombres complexes comme 
des classes d’équivalence de polynômes à 
coefficients réels modulo le polynôme irré- 
ductible X 2 -J- 1 . C’est cette approche qui 
allait conduire Kronecker à la théorie géné- 
rale des corps de nombres algébriques 
(cf. corps). 


2. Le corps des nombres complexes 
Construction 

Par définition, un nombre complexe sera un 
couple z — (x, y) de deux nombres réels ; 
si i ~ (x, y) et z — (x', ÿ) sont deux 
nombres complexes, on appelle alors 
somme et produit de ces deux nombres 
complexes les nombres complexes : 

z +z’ = (x +x\y +/) 
et zz = ( xx ' — yy, xy + x'y). 

Il est alors facile de vérifier que, pour 
ces deux opérations, l’ensemble des cou- 
ples de nombres réels est un corps, le corps 


C des nombres complexes ; par exemple, si 
z — (x, y) ^ (0, 0), son inverse est le nom- 
bre complexe : 

. - *-) 

\ X 2+y2 X 2 + yl) 

aussi noté 1/z. 

Tl est aussi souvent commode de repré- 
senter géométriquement le nombre com- 
plexe z = (x, y) par le point M de coor- 
données (x, y) dans le plan muni d’un 
système d’axes de coordonnées ortho- 
normé ; M s’appelle Yimage de z et il est 
clair que tout point M du plan est l’image 
d’un unique nombre complexe appelé 
affixe de M. 

Les nombres complexes de la forme 
(x, 0) forment un sous-corps de C qui est 
isomorphe au corps R des nombres réels 
par l’application qui à (x, 0) fait corres- 
pondre x ; dans la suite, nous identifierons 
donc le nombre complexe (x, 0) au nombre 
réel x, ce qui fait apparaître R comme un 
sous-corps de C. Parmi les nombres com- 
plexes, les nombres réels ont donc pour 
images les points de l’axe Ox, appelé pour 
cette raison axe réel ; remarquons que si a 
est un nombre réel, le produit de a et du 
nombre complexe z = (x, >’) est simple- 
ment az — (ax, ay ). 

Le nombre complexe i = (0,1) vérifie 
/ 2 = — 1 , et tout nombre complexe 
z = (x, y) peut s’écrire de manière unique 
z = x + iy, pour x et y réels ; nous adop- 
tons désormais cette écriture, dite carté- 
sienne, pour tout nombre complexe. Les 
nombres réels x et y s’appellent respecti- 
vement la partie réelle et la partie imagi- 
naire de z et on note : 

Rez = x, Im z — y. 

Les nombres complexes écrits sous 
forme cartésienne satisfont aux règles 
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usuelles du calcul élémentaire, en tenant 
compte du fait que i 2 = — 1 ; par exem- 
ple : 

(x + iy)(x' + iy ') 

= xx ' ixy' + ix 'y + i 2 yy ' 

= xx'—yy' + i (xy’ + x'ÿ), 

ce qui redonne la formule ci-dessus du 
produit. Les nombres complexes non 
nuis de la forme iy , y G R, ont pour 
carré le nombre réel négatif — y 2 ; 
pour cette raison, ils sont dits imaginaires 
purs et l’axe Oy est appelé Y axe imagi- 
naire. 

On appelle conjugué du nombre com- 
plexe z = x -j- iy le nombre complexe 
z == -X “ iy ; l’application de conjugaison, 
qui à tout nombre complexe fait corres- 
pondre son conjugué, est un automor- 
phisme involutif du corps C, c’est-à-dire 
que l’on a : 

z+z'=z+z', zz’ —zz', z = z ; 

il en résultepar exemple que si z ^ 0, alors 
z^O et l/z = l/j. 

Pour tout nombre complexe z, le pro- 
duit N (z) — zz — x 2 -f- y 2 est un nombre 
réel positif ; c’est le carré de la distance de 
l’image de z à l’origine des coordonnées. 
On appelle module de z le nombre réel 
positif : 

\z\ — Vx 2 4- y 2 — Vzf ; 

le module des nombres complexes possède 
les mêmes propriétés que la valeur absolue 
des nombres réels : | z | — 0 si et seulement 
si z = 0 ; 

! z + z 'l < 1*1 + |*'|; I»' I = l*ll*'|. 

Remarquons que l’inverse d’un nombre 
complexe non nul est égal à 1 /'z = z/j z p ; 
en particulier, les nombres complexes de 
module 1, sur lesquels nous reviendrons, 
ont pour inverse leur conjugué. 


Le théorème fondamental de l'algèbre 

Les nombres complexes sont donc apparus 
très tôt comme le domaine naturel de la 
théorie des équations algébriques : toute 
équation algébrique peut être résolue dans 
ce corps. Plus précisément, le résultat 
fondamental est le suivant. Si P est un 
polynôme de degré n à coefficients com- 
plexes, il existe n nombres complexes 
a 2 , ..., a, v pas nécessairement distincts, 
tels que l’on ait identiquement : 

P(z) - \ {z — a x )(z— a 2 ) ... (z — a n ), 

où À est le coefficient du terme de plus haut 
degré. Ainsi, si l’on appelle ordre de 
multiplicité d’une racine le nombre de fois 
où elle apparaît dans la décomposition 
ci-dessus, tout polynôme de degré n a 
exactement n racines, chacune étant comp- 
tée avec son ordre de multiplicité. 

Cette propriété était implicite pour de 
nombreux mathématiciens, mais c’est à 
d’Alembert que l’on doit la première 
tentative de démonstration, d’où le nom de 
théorème de d’Alembert que l’on donne 
souvent à cet énoncé. La démonstration de 
d’Alembert (1746) repose sur une argu- 
mentation analytique habile mais qui uti- 
lise des résultats de topologie. On doit à 
Euler (Recherches sur les racines imaginai- 
res des équations , 1751) la première ten- 
tative de démonstration algébrique, qui fut 
reprise et améliorée tout au cours du 
xvm e siècle par Lagrange, Laplace et 
d’autres. Mais ces démonstrations présen- 
taient toutes des lacunes importantes. 
Gauss, dans sa dissertation de 1799, en fait 
l’historique critique et donne la première 
démonstration complète. Tl reviendra à 
plusieurs reprises sur ce sujet et ne donnera 
pas moins de quatre démonstrations dif- 
férentes du théorème fondamental de 
l’algèbre. Les développements de la théo- 
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rie des fonctions de variable complexe 
au xix e siècle ont vu naître d’innom- 
brables démonstrations de ce résultat 
(cf. fonctions analytiques - Fonctions 
analytiques d’une variable complexe, 
chap. 4). 

Un corps sur lequel tout polynôme se 
décompose en facteurs du premier degré 
est dit algébriquement clos ; cette pro- 
priété explique par exemple pourquoi la 
théorie des courbes algébriques se déve- 
loppe plus harmonieusement sur le corps 
des nombres complexes que sur le corps 
des nombres réels (cf. courbes algébri- 
ques). 

Limites 

Puisque le module des nombres complexes 
possède les mêmes propriétés que la 
valeur absolue des nombres réels, on 
peut définir de manière analogue toutes 
les notions relatives aux limites ; remar- 
quons d’ailleurs que les définitions qui 
suivent, appliquées au cas particulier des 
nombres réels, redonnent toutes les 
notions correspondantes pour ces nom- 
bres. 

On appelle suite de nombres complexes 
la donnée, pour tout entier naturel /?, d’un 
nombre complexe z n ; la suite correspon- 
dante est alors notée (z n ). On dit qu’une 
suite (z„) de nombres complexes tend vers 
une limite w, ou converge vers u , pour n 
tendant vers l’infini, si pour tout nombre e 
strictement positif, on a : 

ki, — «I < e 

pour n assez grand, c’est-à-dire sauf pour 
au plus un nombre fini d’entiers n. On écrit 
alors : 

lim z_ = u. 

« -—oc 

La limite si elle existe est déterminée de 
manière unique, et toutes les propriétés 


usuelles des suites de nombres réels ne 
faisant pas intervenir la relation ^ sont 
valables ici ; en particulier, le critère de 
Cauchy, qui permet d’affirmer qu’une suite 
est convergente sans connaître sa limite, 
s’applique. 

Les séries de nombres complexes jouent 
un rôle absolument essentiel car elles 
interviennent dans la définition des fonc- 
tions analytiques d’une ou de plusieurs 
variables complexes, qui est une branche 
fondamentale de l’analyse. Soit (z n ) une 
suite de nombres complexes et soit (y,) la 
suite des sommes partielles : 

s„ = Zq + Zi + ... + z n ; 

on dit que la série de terme général z )V ou 
que la série : 

z- 

est convergente de somme S, et on écrit : 



si la suite (s„) converge vers S. Les séries 
permettent de définir de nombreuses fonc- 
tions ; ainsi, la série de terme général z n /n ! 
converge pour tout nombre complexe z et 
sa somme, la fonction exponentielle com- 
plexe : 



n = 0 


est sans conteste une des fonctions les plus 
importantes des mathématiques (cf. expo- 
nentielle et logarithme). La règle de 
multiplication des séries permet d’établir la 
propriété fondamentale de la fonction 
exponentielle : si z et z sont deux nombres 
complexes, on a : 

(*) **+*' = «***'. 
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3. Forme trigonométrique 
Trigonométrie 

Les nombres complexes de module 1 
peuvent être caractérisés comme les nom- 
bres complexes ^ 0 dont le conjugué et 
l’inverse sont égaux ; on vérifie facilement 
qu’ils forment un groupe multiplicatif que 
nous désignerons par U. Les images des 
éléments de U sont les points du cercle de 
centre O et de rayon 1 (appelé souvent 
« cercle trigonométrique ») ; l’application 
qui au nombre complexe wGU, d’image 
M, fait correspondre l’angle A(w) du demi- 
axe réel positif avec la demi-droite OM est 
un isomorphisme du groupe multiplicatif 
U sur le groupe additif des angles orientés 
de demi-droites et pourrait d’ailleurs servir 
à donner une définition rigoureuse de ces 
angles. L’étude du groupe U constitue ce 
qu’on appelle traditionnellement la trigo- 
nométrie ; l’outil pour définir de façon 
correcte les fonctions trigonométriques est 
la fonction exponentielle complexe. 

Pour tout nombre réel t , le nombre 
complexe e i{ appartient à U. En effet, on 
voit facilement sur le développement en 
série de e z que le conjugué de e z est e 1 pour 
tout nombre complexe z ; on a donc, en 
utilisant aussi (*), 

| e ix j 2 = e il e ü = e u e~ if = e° = 1 ; 

la formule (*) montre aussi que l’on a : 

(**) e'tf + O =~ e ü e i( \ 

ce qui exprime que l’application qui au 
nombre réel t associe le nombre complexe 
e 11 G U est un homomorphisme du groupe 
additif R sur le groupe multiplicatif U. 

Par définition, on appelle cos t et sin î 
respectivement les parties réelle et imagi- 
naire de ë l , soit : 

e lt = cos t + / sin t ; 


puisque | e 11 \ = 1, on a cos 2 / 1 ~f- sin 2 t = 1 
pour tout nombre réel t. 

L’étude de ë* (cf. exponentielle et 
logarithme) montre alors qu’il existe un 
nombre réel tt > 0 tel que e ,n / 2 = i et tel 
que l’application qui à t associe ë l soit une 
bijection de l’intervalle [0, 2 ?r[ sur U. 
Puisque, d’après (*) : 

<? 2 '* = (é?'*/2)4 = /4 = x 

on en déduit, toujours d’après (*), que la 
fonction ë* est périodique de période 2 tt. 
Ainsi, tout nombre complexe u de module 
1 s’écrit sous la forme : 

u = e u — cos / + / sin t, 

où t est un nombre réel déterminé à 2 /ctt 
près, k entier relatif ; cela revient à dire que 
si x et y sont deux nombres réels tels que 
x 1 + y 2 = 1 , il existe un nombre réel r, 
défini à 2 kir près, tel que x = cos t et 
v = sin /. La propriété (**) montre, 
d’autre part, que si t et f sont deux 
nombres réels, on a : 

(cos t + i sin r) (cos t ' + / sin / ') 

= cos (t + t') + i sin (t + / '), 

ce qui, en égalant les parties réelles 
et imaginaires des deux membres, donne 
les formules trigonométriques d’addition 
des arguments. On déduit facilement 
de ce qui précède la formule de De 
Moivre, valable pour tout entier rela- 
tif u, 

(cos t y i sin t) n — cos nt 4* i sin nt, 

qui permet d’obtenir de nombreuses for- 
mules de trigonométrie. 

Forme trigonométrique 

Nous désignerons par C* le groupe mul- 
tiplicatif des nombres complexes non nuis. 
Si z ^ 0, le nombre complexe zj \z \ est de 
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module 1 et on voit facilement que l’appli- 
cation qui à tout nombre complexe 2^0 
associe le couple (| z |, z/| z |) est une bijec- 
tion de C* sur l’ensemble Rf X U des 
couples (r, u) d’un nombre réel r > 0 et 
d'un élément wGU; la bijection réci- 
proque associe à un tel couple (r, u) le 
nombre complexe ru , de module r. L’étude 
de U faite ci-dessus permet donc d’écrire 
tout nombre complexe z ^ 0 sous la 
forme : 

z = re iï = r (cos t + / sin /), où r = \z | , 

appelée forme trigonométrique du nombre 
complexe z. On dit qu’une telle valeur de t 
est un argument de z ; quand on connaît 
une valeur de l’argument, on obtient donc 
toutes les autres en lui ajoutant un multiple 
entier relatif de 2 tt et deux nombres com- 
plexes sont égaux si et seulement s’ils ont le 
même module et des arguments qui diffè- 
rent de 2 kir, k entier relatif. Si on impose 
à l’argument d’appartenir à l’intervalle 
]— tt, — |— tt], il est déterminé de manière 
unique et s’appelle V argument principal . 

Racines n-ièmes 

La recherche des nombres complexes z tels 
que z n = 1 va montrer l’intérêt de la forme 
trigonométrique. Écrivant z sous forme 
trigonométrique : 

2 = r(cos / + i sin t), 

on doit avoir : 

z n ~ r n (cos t + i sin t ) n 

= r n (cos nt + i sin nt) = 1 ; 

les nombres z" et 1 sont égaux s’ils ont le 
même module, soit r" — 1, d’où r — 1, et 
s’ils ont des arguments qui diffèrent d’un 
multiple entier de 2 jt, soit nt =2 kir, avec 
k entier relatif, en prenant 0 pour argu- 
ment de 1 . On peut donc écrire t = 2 kir/ 
n ; si on se limite aux valeurs de t appar- 


tenant à l’intervalle [0, 2ir], il suffit de 
donner à k les n valeurs successives 0, 1, 
2, ..., n — 1 , car toute autre valeur de k 
donne des valeurs correspondantes de t 
égales, à un multiple de 2 tt près, aux 
valeurs de t obtenues pour ces nombres. 
On obtient ainsi n nombres complexes de 
module 1 distincts : 

2kn . 2kit 
z k = cos — + i sin » 
n n 

où k = 0, 1, 2, ..., n — 1 ; ces nombres 
complexes sont les n racines du polynôme 
z” — 1 et leurs images sont les sommets 
d’un polygone régulier inscrit dans le 
cercle trigonométrique (fig. 2). 



Un raisonnement analogue montrerait 
que tout nombre complexe non nul a n 
racines ft-ièmes distinctes ; si c est l’une 
d’entre elles, ces racines sont : 

CZ q, CZ j , . . . , cz n j , 

où les z k sont les racines /7-ièmes de 1 . 

JEAN-LUC VERLEY 
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CONIQUES 


L J étude des coniques a été pendant 
deux millénaires le terrain de prédi- 
lection des géomètres qui ont accumulé sur 
ce sujet d’innombrables théorèmes. Dès la 
fin du m e siècle avant J.-C., les mathéma- 
ticiens avaient obtenu par des méthodes 
purement géométriques des résultats très 
complets : le Traité des sections coniques 
d’Apollonius (né vers 245 avant J.-C.) est 
un des sommets de la mathématique grec- 
que. 

Le xvn e siècle allait voir à nouveau se 
développer la théorie des coniques dans 
deux directions très différentes. Descartes 
met en évidence les équations des coniques 
et reconnaît qu’elles constituent les cour- 
bes du second degré, tandis que Pascal et 
Desargues donnent une impulsion consi- 
dérable à la géométrie pure en inaugurant 
l’étude projective des coniques. 

De nos jours, les mathématiciens ne se 
préoccupent plus guère d’enrichir l’herbier 
un peu vieillot des théorèmes sur les 
coniques, qui ont été réduites à un chapitre 
de la théorie des formes quadratiques. Une 
conique apparaît aujourd’hui comme une 
courbe non vide du plan projectif, définie 
par une équation Q(x, y, t) = 0, où Q est 
une forme quadratique en les coordonnées 
homogènes x, y, t ; cette définition est la 


seule qui contienne tous les cas particuliers 
et elle s’étend immédiatement en dimen- 
sion supérieure aux quadriques et aux 
hyperquadriques. 

On se limite dans ce qui suit à des 
résultats purement classiques, en ren- 
voyant à l’article formes quadratiques 
pour un exposé plus moderne. 

E. U. 

1. Les sections coniques 
Le cône circulaire 

Le cercle est la figure conique la plus simple 
et la plus ancienne ; il a été considéré 
comme une figure bien avant le couple de 
droites, pourtant plus simple a priori (de 
tels couples existent dans toute géométrie, 
alors que le cercle n’apparaît que dans 
quelques-unes). On peut alors définir le 
cône circulaire, ensemble des droites 
s’appuyant sur un point fixe (le sommet O) 
et sur un cercle (la base C). Le plus simple 
de ces cônes est le cône de révolution, où la 
droite qui joint O au centre de C est 
perpendiculaire au plan du cercle. 

Les sections d’un cône circulaire par un 
plan sont appelées sections coniques. On 
peut ainsi obtenir, outre le cercle, des 
ellipses, des paraboles, des hyperboles et 
des figures particulières (droites sécantes si 
le plan passe par le sommet, droites 
confondues s’il contient de plus une tan- 
gente au cercle). Seul échappe à cette 
définition (conforme à l’étymologie) le cas 
de deux droites parallèles distinctes. 
Celui-ci pourra néanmoins venir complé- 
ter la famille en application du théorème : 
Toute section plane d'un cône dont une base 
est une conique est elle-même une conique 
ou le plan tout entier . 
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Ce théorème capital, qui va beaucoup 
plus loin que la définition grecque (qui ne 
considérait que certains types de cônes), 
affirme en quelque sorte que la notion de 
conique est la notion projective fondamen- 
tal c’est-à-dire la notion invariante dans 


que les coniques ont été reconnues et 
étudiées. Dans un plan métrique tel que le 
plan euclidien traditionnel, les cas parti- 
culiers de coniques décomposées sont 
triviaux et on ne les considérera plus 
dai ^k cad r £ de. cet article, ILsufjjra de 


considérations amnes et surtout métriques cercle). 
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Étant donné une droite D, appelée 
directrice, et un point F (le foyer) non situé 
sur elle, la parabole est : 

- l'ensemble des points M qui sont centre 
d’un cercle passant par F et tangent à la 
droite D (définition 1 ) ; 

- l’ensemble des points M tels que la 
distance MF soit égale à la distance MH 
de M à la droite D (définition 2). 

La perpendiculaire à D issue de F est 
l’axe de la parabole. Si elle coupe la 
directrice en un point K, la distance 
FK = p est le paramètre de la parabole. 
Le sommet S, situé sur la courbe, est le 
milieu de KF ; la médiatrice de KF est 
d’ailleurs la tangente au sommet. Toute la 
courbe est connexe, convexe et symétrique 
par rapport à Taxe (fig. 1). 



Tangentes 

En chaque point M de la parabole, il existe 
une tangente. Celle-ci est bissectrice de 
l’angle formé par MF et la parallèle à 
l’axe ; cette bissectrice rencontre l’axe en 
un point T tel que S soit milieu de la 
projection sur l’axe du segment MT : cela 


détermine entièrement la tangente en M 
(fig. 1 ). La normale co upe Ta xe en un point 
N tel que les vecteurs KF et MN aient des 
projections de même valeur sur l’axe : 
l’invariance de la projection de MN est une 
propriété caractéristique de la parabole. 

Tout point d’une parabole pouvant 
être pris comme sommet si l’on modifie 
convenablement la condition d'orthogo- 
nalité dans le plan, certaines des propriétés 
précédentes sont en fait affines et non 
réellement métriques. Prenons par exem- 
ple une parallèle quelconque (H) à 
l’axe. Elle coupe la parabole en un point 
unique Z où la tangente sera notée (V) : 
on constate alors que la parabole est 
invariante dans la symétrie par rapport à 
(H) parallèlement à (V), et que Z est le 
milieu de la projection de la partie de 
tangente à la parabole comprise entre son 
point de contact et (H) [fig. 2], (H) est 
appelé diamètre de la direction de (V), 
c’est-à-dire ensemble des milieux des seg- 
ments PQ parallèles à (V) dont les extré- 
mités sont sur la parabole ; les tangentes 
en P et Q se coupent d’ailleurs sur (H). La 
démonstration de ces propositions peut se 
ramener à une simple projection d’une 
parabole sur un autre plan, Z étant 
alors l’image du sommet, (H) celle de 
l’axe, etc. 

Le dénombrement des points d'inter- 
section d’une droite avec une parabole, la 
partition du plan en « extérieur » et « inté- 
rieur » sont naturellement des notions 
affines. On se bornera pourtant, pour la 
commodité, à considérer une parabole 
métrique, la projection signalée ci-dessus 
permettant l’extension de ces notions à une 
parabole affine. 

Intersection avec une droite 

Une droite coupe une parabole en un ou 
deux points. Si le point d’intersection est 
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unique et la droite non parallèle à l’axe, 
la droite est tangente. Pour qu’il en soit 
ainsi, il faut et il suffit que la projection 
du foyer F sur elle appartienne à la 
tangente au sommet, ce qui donne une 
définition traditionnelle de la parabole 
comme enveloppe de droites (dont la 
projection sur elles d’un point fixe décrit 
une droite fixe). Le point de contact est 
alors aisément déterminé par sa projection 
sur l’axe, symétrique de T par rapport à S. 
Il existe une tangente unique ayant une 
direction donnée, sauf si celle-ci est celle 
de l’axe. Si une tangente variable coupe 
deux tangentes fixes distinctes en U et U', 
les abscisses de ces points sont liées par 
une relation affine (y = ax -\- b), ce qui 
est une propriété affine, et le triangle UFU' 
reste semblable à lui-même (ses angles 
sont constants), ce qui est une propriété 
métrique ; toutes deux sont caractéristi- 
ques de la parabole. Si les tangentes fixes 
se coupent en V, F appartient au cercle 
(UVU') et l’orthocentre du triangle UVU' 
est sur la directrice. 


Donnons-nous une droite quelconque 
D. Si la projection de F sur D est sur la 
tangente au sommet, on vient de voir que 
D est une tangente à la parabole. Si cette 
projection est du même côté de cette 
tangente au sommet que F, D coupe 
effectivement la parabole en deux points 
distincts (un seul si D est parallèle à l’axe) 
que l’on peut construire à la règle et au 
compas (suivant les vieilles règles grec- 
ques). Si cette projection est située dans 
l’autre demi-plan, il n’existe aucun point 
d’intersection. 

Prenant le problème d’un point de vue 
différent, on peut chercher les tangentes à 
la parabole issues d’un point donné M. 11 
en existe une seule si M est sur la courbe. 
Sinon MF > MH définit l’extérieur de la 
parabole, d’où l’on peut mener deux tan- 
gentes à la courbe (perpendiculaires si M 
appartient à la directrice) ; de l’intérieur, 
caractérisé par MF < MH, on ne peut 
mener de tangentes. Le foyer est à l’inté- 
rieur. 

Propriétés différentielles et intégrales 

Par un point donné, il peut exister jusqu’à 
trois normales à la parabole, coupant 
celle-ci en trois points définissant un cer- 
cle passant par le sommet, et un triangle 
dont le centre de gravité appartient à 
l’axe. 

Le centre de courbure C en M, point où 
la normale en M est tangente à son 
enveloppe, se projette en P sur MF de 
façon que FM = FP = FN (N étant 
l’intersection de la normale et de l’axe) ; 
CM = R est le rayon de courbure, lié à 
MF par l’égalité />R 2 — 8MF 3 . La normale 
CN M cou pe la directrice en D tel que CM 
= 2 MD. 

L’aire comprise entre un arc de para- 
bole SM, l’axe et la projetante de M sur 
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l’axe est égale aux deux tiers de l’aire du 
rectangle de diagonale SM, de côtés paral- 
lèles et perpendiculaires à l’axe (une telle 
propriété se conserve, mutatis mutandis , 
par projection). Cette quadrature, la pre- 
mière du genre, était déjà connue d’Archi- 
mède qui utilisait là sa méthode d’exhaus- 
tion (cf. calcul infinitésimal). Des 
géomètres tels que Roberval retrouvèrent 
ce résultat par des raisonnements inspirés 
de la mécanique et du fait que la portion 
de tangente comprise entre M et l’axe était 
coupée en son milieu par sa tangente au 
sommet : ils obtenaient ainsi deux arcs 
symétriques de paraboles découpant trois 
aires égales dans un rectangle (fig. 3). 

fig. 3 ; 



Quadrature de la parabole 


La plupart des propriétés de la para- 
bole sont évidemment généralisables aux 
autres coniques, dites coniques à centre ; 
pour certaines d’entre elles, la parabole 
apparaît en quelque sorte comme un 
moyen terme entre l’ellipse et l’hyperbole. 
Mais la parabole garde son originalité : par 
exemple, ce qui est rare pour une conique 
autre qu’un cercle, la parabole est recti- 
fiable, ce qui veut dire que l’on peut 
donner une formule explicite pour la 
longueur d’un arc de parabole SM. Dans 
un système d’axes orthogonaux d’origine 
S dont l’axe des abscisses est l’axe de la 


parabole, si t est un nombre tel qu’abscisse 
et ordonnée de M soient égales respecti- 
vement à : 

x = {p/2) sh 2 1, y = p sh / (d’où y 2 — 2 px), 
alors la longueur de l’arc SM est : 

5 = (p/4) (2 1 + sh 20- 

Les longueurs des arcs des autres coni- 
ques ne peuvent s’exprimer en général qu’à 
l’aide de fonctions elliptiques. 

3. Les coniques à centre 
Foyers 

Pour les coniques à centre, les deux 
définitions métriques courantes sont les 
suivantes : 

- l’ensemble des points M qui sont centre 
d’un cercle passant par un point donné F 
et tangent à un cercle donné C de centre 
F' : définition bifocale (fig. 4) ; 



- l’ensemble des points M tels que la 
distance MF soit proportionnelle à la 
distance MH de M à la droite D (directrice 
associée à F) : définition monofocale. 
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La première met en jeu deux foyers, F 
et F', et le cercle directeur C de centre F' 
et de rayon (2a). Par hypothèse, FF' = 2c 
est distinct de 2a (F n’appartient pas à C'). 
Si l’on peut écrire c < a, alors F est 
intérieur à C' et la courbe obtenue, lieu de 
M tel que : 

MF + MF' = 2a, 

est une ellipse, convexe, connexe et bornée 
(fig. 5). Si c > a, F est extérieur à C' : 


fîg. 5 
B 


| B' 

Ellipse 


l’hyperbole obtenue est composée de 
deux parties convexes et connexes res- 
pectivement définies par MF — MF' = 2 a 
et MF' — MF = 2a. Pour un cercle, 
c = 0. 

Ces coniques admettent deux axes de 
symétrie perpendiculaires (dont FF', 
appelé axe focal) et un centre de symé- 
trie O, milieu de FF'. L’axe focal coupe 
la courbe aux sommets À et À', tels 
que : 

OA = OA' = a. 

Une ellipse a deux autres sommets B et B' 
sur l’axe secondaire de symétrie, définis 
par OB = OB' = b avec 

a 1 — c 2 — b 2 (fig. 5). 


Pour une hyperbole, on pose au contraire : 
c 2 — a 2 = b 2 , si Ton veut n’utiliser que des 
nombres réels. 

Tangentes 

En chaque point d’une conique à centre il 
existe une tangente. Celle-ci est la bissec- 
trice de l’angle géométrique FMF' (exté- 
rieure pour l’ellipse, fig. 6, intérieure pour 



l’hyperbole). On ne peut mener deux 
tangentes MT et MT' distinctes à la 
conique que par un point M extérieur à 
celle-ci, défini par exemple par la relation 
MF > rMH, où e = cja est l’excentricité 
de la conique (inférieure à 1 pour l’ellipse, 
égale à 1 pour la parabole par définition, 
et supérieure à 1 pour l’hyperbole). Sur la 
conique même (MF — cMH), ce qui est la 
seconde définition, il y a une tangente 
unique (double). D’un point intérieur 
(MF < cMH) on ne peut pas mener de 
tangentes ; c’est notamment le cas en F ou 
en F'. Si les tangentes existent, MT et MT' 
ont mêmes bissectrices que MF et MF' ; de 
plus FM est bissectrice de l’angle TFT' 
(cf. fig. 7, pour l’ellipse). MT est per- 
pendiculaire à MT' si M appartient au 
cercle de Monge, de centre O et de rayon 
y/2 a 2 — c 2 (pour e ^ Vï). 
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Tangentes issues d'un point 

La projection de F sur une tangente 
décrit le cercle de diamètre AA' ; si la 
projection de F sur une droite est dans la 
même région que F par rapport à ce 
cercle, la droite donnée coupe la conique 
en deux points distincts que Ton peut 
construire ; si la projection est dans l’autre 
région, la droite ne coupe pas la conique. 
On peut déduire de cela des définitions 
de l’ellipse et de l’hyperbole comme 
enveloppes de droites, comme pour la 
parabole. 

Parmi les tangentes à une hyperbole, 
deux sont particulières. Issues de O, elles 
n’ont aucun point de contact à distance 
finie avec la courbe dont elles sont des 
asymptotes ; elles déterminent deux angles 
contenant chacun une branche connexe de 
l’hyperbole. 

Correspondances linéaires 

Si une tangente variable coupe deux tan- 
gentes fixes à une conique à centre, les 
abscisses x et x des deux points d’inter- 
section sont reliées par une relation homo- 
graphique du type : 

axx' + bx + ex' + d = 0. 


Il existe une réciproque importante à 
cette propriété affine : une droite joignant 
deux points de deux droites fixes dont les 
abscisses sont reliées par une telle relation 
(où a ^ 0) enveloppe une conique à centre 
(a = 0 correspond à une parabole). Le 
produit des distances des deux foyers à une 
tangente variable est égale à b 2 ; les foyers 
sont de part et d’autre pour une hyperbole, 
du même côté pour une ellipse. Certaines 
des propriétés précédentes s’étendent 
naturellement à une parabole, en suppo- 
sant par exemple que la direction de F' est 
celle de l’axe. 

Pour que quatre points d’une conique 
soient sur un même cercle, il faut et il 
suffit que deux des cordes les joignant 
soient symétriques par rapport aux 
axes de la conique. D’un point du plan, 
on peut mener jusqu’à quatre normales à 
une conique à centre. Les pieds de trois 
d’entre elles et le point diamétralement 
opposé au quatrième sont sur un même 
cercle. 

Si l’on se donne deux directions per- 
pendiculaires, les points d’où les tangentes 
issues ont des directions symétriques par 
rapport à ces directions privilégiées appar- 
tiennent à une hyperbole (équilatère) de 
même centre que la conique, passant par 
les deux foyers ; il en serait de même si l’on 
remplaçait les deux directions choisies par 
celles de leurs bissectrices, d’où la position 
des foyers à l’intersection des deux hyper- 
boles. 

Propriétés différentielles et intégrales 

La normale en M coupe l’axe focal en N 
tel que NF = eMF. La perpendiculaire en 
N à MN coupe MF en P, projection du 
centre de courbure C en M sur MF, et 
coupe MO en Q, point tel que QC soit 
perpendiculaire à l’axe focal (fig. 8) : cela 
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fig 8 



Centre de courbure 


fournit deux constructions du centre de 
courbure, sauf aux sommets de l’axe focal 
où le rayon de courbure R — MC est égal 
à p = b 2 !a , paramètre de la conique (et 
longueur de la demi-corde issue de F et 
perpendiculaire à FF'). En un point quel- 
conque, on a : 

a 2 b 2 R 2 = MF 3 MF' 3 , p 2 R = MN 3 . 

On retrouve aussi le paramètre comme 
longueur de la projection orthogonale de 
MN sur MF ou MF'. Si N' est sur la 
médiatrice de FF' et sur MN, MN' se 
projette suivant une longueur égale à a sur 
MF o u MF', et les trois vecteurs N'N, 
N'M et NM sont proportionnels aux 
nombres c 2 , a 2 et a 2 — c 2 ( b 2 pour une 
ellipse, — b 2 pour une hyperbole). 

Les centres de courbure en les sommets 
A et B d’une ellipse sont alignés avec le 
point d’intersection des tangentes en A et 
B ; cette droite est perpendiculaire à AB ; 
la construction des cercles de courbure en 
A et B permet une construction graphique 
très soignée de l’arc AB. 


Pôles et polaires 

Si une corde MM' coupe la directrice D 
en P, FP est une bissectrice de l’angle 
MFM'. Si MM' passe par F, les tangentes 
en M et en M' se coupent en T sur 
la directrice, et P est conjugé harmoni- 
que de F par rapport à M et M' ; de 
plus l’angle MFT est droit. Cette direc- 
trice D est située à une distance a 2 !c 
de O, est perpendiculaire à l’axe focal et 
située du même côté de O que F. Elle 
n’existe pas pour un cercle pour lequel F, 
F' et O sont confondus, d’où c — e = 0 ; 
cela fait que la définition monofocale, 
qui masque déjà le caractère de double 
symétrie de la conique, n’est pas aussi 
générale qu’elle paraît. Il existe naturelle- 
ment une directrice analogue D' pour 
l’autre foyer F'. 

Pour une conique propre quelconque, à 
centre ou parabole, les conjugués harmo- 
niques d’un point fixe M par rapport aux 
extrémités P et Q d’une corde passant par 
M sont situés sur une droite, appelée 
polaire de M (fig. 9). Ainsi une directrice 
est la polaire du foyer correspondant. Seul 



Polaire 
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le centre n’a pas de polaire. Un point de 
la conique a sa tangente comme polaire. 
Toute droite ne passant pas par le centre 
éventuel est la polaire d’un certain point 
qui est appelé son pôle. 

Si la polaire de M passe par M', celle de 
M' passe par M. Si M, P, Q sont alignés, 
leurs polaires sont concourantes et réci- 
proquement. Si MT et MT' sont des 
tangentes issues de M, la corde TT' qui 
joint leurs points de contact est la polaire 
de M (cf. fig. 9 pour l’ellipse). Ces pro- 
priétés peuvent être obtenues très simple- 
ment par perspective (conique éventuelle- 
ment) à partir des propriétés analogues 
pour le cercle, où elles sont bien connues ; 
elles sont projectives en dépit des appa- 
rences. 

Diamètres 

Donnons-nous une direction D ; les 
milieux des cordes parallèles à D sont 
situés sur un diamètre, c’est-à-dire une 
droite passant par le centre (ellipse ou 
hyperbole) ou parallèle à l’axe (parabole). 
La conique est invariante dans la symétrie 
par rapport à ce diamètre parallèlement 
à la direction D. Fixons un point M ; à 
tout diamètre de direction D, associons 
son point d’intersection avec la perpen- 
diculaire issue de M au diamètre conju- 
gué de D défini ci-dessus. Ces points 
engendrent une hyperbole (équilatère), 
coupant la conique aux points où la 
normale passe par M, ce qui permet de les 
construire. 

Pour une ellipse, à tout diamètre D, on 
peut associer le diamètre conjugué D' dont 
D est à nouveau le conjugué. D et D' 
coupent l’ellipse en P et Q, par exemple, 
tels que la tangente en P soit parallèle à D', 
et forme avec D, D' et la tangente en Q, 
un parallélogramme d’aire constante. 


égale à ab , comme on le voit en prenant les 
axes de l’ellipse pour D et D' (fig. 10). De 



Diamètres conjugués d'une ellipse 


plus OP 2 + OQ 2 = a 2 -j- b 2 est constant. 
De tels diamètres conjugués sont simple- 
ment les projections orthogonales de deux 
diamètres perpendiculaires d’un cercle de 
diamètre AA' placé de façon que l’ellipse 
soit sa projection : la plupart des propriétés 
de la conjugaison (ainsi que la formule 
donnant l’aire de l’ellipse : S = i iab) sont 
des conséquences immédiates de cette 
projection. 


4. Propriétés particulières 
L'ellipse 

Une construction très simple permet 
d’obtenir autant de points de l’ellipse que 
l’on en désire. Donnons-nous deux droites 
perpendiculaires Ox et Oy, et un segment 
constant PQ dont les extrémités décrivent 
respectivement Ox et Oy (fig. 11). Un 
point M situé entre P et Q tel que MQ = a 
et MP — b décrit une ellipse de centre O, 
d’axe focal Ox La tangente en M est 
perpendiculaire à IM, où I est le quatrième 
sommet d’un rectangle OPIQ. Deux posi- 
tions perpendiculaires de PQ (appelé 
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Bande de papier 


« bande de papier » dans la littérature) 
correspondent à deux extrémités de dia- 
mètres conjugués, I décrit le cercle de 
centre O et de rayon (a + b) ; le symétri- 
que J de I par rapport à M est lui aussi sur 
la normale en M ; il décrit le cercle de 
centre O et de rayon (a — b), et Ox est 
bissectrice intérieure de l’angle IOJ ; IJFF' 
sont sur un même cercle, et forment la 
figure connue sous le nom de quadrangle 
harmonique, inverse d’une division har- 
monique (fig. 1 1). 

La projection considérée, que l’on 
peut relier à l’affinité d’axe AA' et de 
rapport bja , qui transforme le cercle de 
diamètre AA' en l’ellipse, est à l’origine 
d’une représentation paramétrique parti- 
culièrement simple de celle-ci. Le trans- 
formé du point du cercle définissant, avec 
Ox, un angle t est en effet le point de 
l’ellipse de coordonnées x = a cos /, 
y — b sin t ; ?est l’anomalie excentrique de 
ce point. Deux extrémités de diamètres 
conjugués, dont les pentes dans ce système 
d’axes ont pour produit b 2 /a 2 , ont des 
anomalies excentriques différentes d’un 
angle droit. L’équation de l’ellipse en 
découle ; on pourrait aussi la déduire des 


formules d’Euler, valables également pour 
une hyperbole : 

MF = | a — ex | , MF' = | a + ex \ 

pourvu que F soit le point de coordonnées 
(c, 0). Cette équation s’écrit : 

x 2 /a 2 + y 2 /b 2 = 1. 

L’ellipse intervient notamment en 
astronomie. Tout point attiré par un autre 
point F suivant la loi de Newton décrit une 
conique de foyer F. Les planètes, qui ont 
un mouvement périodique, décrivent des 
ellipses, seules coniques à être bornées. 
L’aire comprise entre la courbe et les 
droites joignant F à deux positions du 
point mobile est proportionnelle à l’inter- 
valle de temps séparant les deux positions ; 
pour une planète, la période T du mouve- 
ment est telle que T 2 soit proportionnel au 
cube c? de la longueur : 

a = OA = AA'/2 ; 

ce sont les fameuses lois de Kepler. 

L'hyperbole 

L’hyperbole, à cause de ses asymptotes, 
possède des propriétés très particulières. Il 
n’existe pas nécessairement de tangentes 
ayant une direction donnée (il suffit de 
considérer des droites passant par le centre 
et situées dans les deux angles déterminés 
par les asymptotes où sont situées les deux 
branches). L’angle de ces asymptotes est 
l’angle 2z défini par cos z= \/e. Les points 
d’intersection avec les tangentes en A et A' 
sont les sommets d’un rectangle de côtés 
2a et 2b. 

Cette dernière propriété se généralise 
de la façon suivante. Considérons un 
diamètre P'OP de l’hyperbole. La droite 
passant par O et parallèle à la tangente en 
P est le diamètre conjugué de la direction 
OP. Il ne coupe pas l’hyperbole. Mais si 
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l’on y construit le point Q tel que OP 2 — 
OQ 2 = a 2 — b 2 , l’aire du triangle OPQ est 
constante (et vaut ab/2) ; quand P varie, Q 
décrit une autre hyperbole, dite conjuguée 
de la précédente, ayant même centre et 
mêmes asymptotes, échangeant a et b avec 
la précédente (fig. 12). De plus, la tangente 



Hyperboles conjuguées 


en Qr est parallèle à OP, et coupe la 
tangente en P sur une asymptote. Enfin la 
conjuguée de la conjuguée est l’hyperbole 
originale. Les deux diamètres « conju- 
gués » OP et OQ forment un faisceau 
harmonique avec les asymptotes. La symé- 
trie par rapport à OP et parallèlement à 
OQ laisse invariante chacune des deux 
hyperboles conjuguées. 

Revenant à une hyperbole simple, la 
famille de ses tangentes jouit d’une pro- 
priété remarquable (due au fait que les 
asymptotes sont des tangentes très parti- 
culières) ; partant du fait qu’une corde 
MM' coupe les asymptote s en de s point s P 
et P' tels que l’on ait MP — P'M', la 
tangente en M coupe les asymptotes en Q 
et Q' tels que M soit le milieu de QQ'. 
QQ'FF' sont situés sur un même cercle et 
forment un quadrangle harmonique. De 
plus, si une droite passant par M coupe les 
asymptotes en P et P' et se déplace 


parallèlement à elle-même, le produit 
MP . MP' reste constant : il est notamment 
égal à b 2 si MPP' est perpendiculaire à 
l’axe focal. 

Lhyperbole équilatère 

Parmi toutes les hyperboles, l’hyperbole 
équilatère, d’excentricité (a = b ), est 
particulièrement intéressante. Ses asymp- 
totes sont perpendiculaires. 

Considérons les sommets A et A', le 
cercle de diamètre AA', un point P décri- 
vant ce cercle (fig. 13). Menons par A la 



droite symétrique de AP par rapport à la 
direction de AA' ; cette droite coupe A' P 
en M, point de la branche contenant A de 
l’hyperbole équilatère de sommets A et A'. 
Le triangle AMA' est pseudo-rectangle, 
c’est-à-dire que la différence des angles en 
A et A' est égale à un droit. La tangente 
en M au cercle (AMA') est perpendiculaire 
à AA', qu’elle coupe en H tel que 
HM 2 = HA . HA' (comme dans un véri- 
table triangle rectangle). Si A'PM coupe la 
tangente au sommet A en le point T, 
conjugué harmonique de A' par rapport à 
M et P, les tangentes en P (au cercle) et en 
M (à l’hyperbole) se coupent sur AT au 
milieu de ce segment ; elles coupent AA' en 
les projections de P et de M ; M se projette 
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sur AT en un point appartenant à OP, etc. 
(fig. 13). Cette figure est la base de la 
correspondance entre les trigonométries 
circulaire et hyperbolique ; elle inspira à 
Abraham de Moivre sa fameuse formule : 

(cos x -f / sin x) n = cos nx + i sin nx. 

Si faire comprise entre OA, OM et 
l’hyperbole est égale à art/ 2, les coordon- 
nées de M (dans les axes convenables) sont 
alors x = a ch t, y = a sh d’où l’équa- 
tion x 2 — >’ 2 = a 2 . Toute hyperbole étant 
affine d’une hyperbole équilatère de même 
sommet, l’équation générale d’une hyper- 
bole est donc : 

x 2 /a 2 — y 2 /b 2 — 1, 

et celle des asymptotes est obtenue en y 
remplaçant 1 par 0. La fonction « guder- 
manien de t », utilisée pour construire les 
cartes géographiques selon la projection de 
Mercator, est définie par : 

/' = 2 arc tg e‘ — tt/2. 

a 2 /2d' est la moitié de faire comprise entre 
OA, OP et le cercle. 

Dans une hyperbole équilatère : 

MO 2 = MF . MF' - MN 2 , 

le rayon de courbure R est tel que 
< 2 2 R = OM\ Si C et C sont deux points 
de l’hyperbole symét rique s par rapport à 
O, les bissectrices de CMC' sont parallèles 
aux asymptotes, et la différence des angles 
C et C' est constante. Tout cercle passant 
par CC' est recoupé suivant un diamètre ; 
un cercle de centre C et de rayon CC' 
recoupe l’hyperbole équilatère suivant les 
sommets d’un triangle équilatéral. Deux 
hyperboles équilatères se coupant en les 
sommets et f orthocentre d’un triangle, on 
peut en déduire de nombreuses propriétés. 
Si une corde MM' se déplace en restant 
parallèle à elle-même, en coupant toujours 


l’hyperbole, le cercle de diamètre MM' 
passe par deux points fixes où la normale 
est parallèle à MM'. 
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CONVEXITÉ 


L a convexité, étude des ensembles et 
des fonctions convexes, constitue une 
branche de la géométrie et de l’analyse qui 
unifie des phénomènes à première vue 
totalement dissemblables. Elle intervient à 
divers niveaux dans des branches très 
variées des mathématiques : théorie des 
nombres, problèmes combinatoires, ana- 
lyse fonctionnelle et applications (théorie 
des graphes, théorie des jeux...). 

La convexité se retrouve dans des 
contextes très divers ; mais le cas fonda- 
mental, le seul qui sera considéré ici, est 
celui des espaces vectoriels sur le corps R 
des nombres réels. 


A. Ensembles convexes 

Un sous-ensemble C d’un espace vectoriel 
réel E est dit convexe si, pour tout couple 
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de points quelconques de C, le segment qui 
a pour extrémités ces deux points est 
entièrement contenu dans C. Par exemple, 
un cube est convexe, mais sa surface ne 
l’est pas, car elle ne contient le segment 
d’extrémités a* et y que si x et y appartien- 
nent à la même face. Les ensembles 
convexes interviennent dans de nombreux 
domaines des mathématiques et il est 
souvent possible, en pareil cas, d’obtenir 
d’intéressants résultats en ne faisant appel 
qu’à des arguments « géométriques » rela- 
tivement élémentaires. 

Minkowski (1864-1909) fut le premier à 
étudier systématiquement les ensembles 
convexes et ses œuvres contiennent la 
plupart des idées importantes utilisées 
pour ce sujet. Les premiers développe- 
ments se limitaient aux espaces vectoriels 
de dimension finie et l’objet principal de 
ces études était de résoudre des problèmes 
de nature quantitative ; depuis 1940, les 
aspects combinatoires et qualitatifs ont 
bénéficié d’une plus grande attention. 
Après quelques préliminaires généraux, on 
traitera d’abord les aspects quantitatifs et 
combinatoires, en se limitant au cas où 
l’espace est de dimension finie ; on abor- 
dera ensuite les aspects qualitatifs de la 
théorie et ses applications à l’analyse 
fonctionnelle. 

Un des aspects les plus fascinants de la 
théorie des ensembles convexes est le 
grand nombre de problèmes très faciles et 
intuitifs à formuler que l’on ne sait pas 
toujours résoudre. 

1 . Propriétés générales 
Définitions 

Soit x et >\ deux points distincts d’un 
espace vectoriel réel E (cf. algèbre 
linéaire et multilinéaire). Par analogie 


avec le cas de l’espace usuel R 3 (représen- 
tation paramétrique de la droite définie 
par deux points), on appelle droite joignant 
x et y l’ensemble des points de E de la 
forme : 

(1 — X)* + 

où À est un nombre réel quelconque. Les 
points tels que X ^ 0 constituent la demi- 
droite xy d’origine x ; les points tels que 
0 ^ X < 1 constituent le segment [.y, y] 
d’extrémités x et y. 

Par définition, on appelle sous-variété 
linéaire de E tout sous-ensemble de E qui 
contient toute droite joignant deux quel- 
conques de ses points ; par exemple, dans 
l’espace usuel R\ les sous-variétés linéaires 
sont : l’ensemble vide, les ensembles 
réduits à un point, les droites, les plans et 
l’espace R 3 tout entier. Toute sous-variété 
linéaire V de E est la translatée d’un 
sous-espace vectoriel de E, c’est-à-dire 
l’ensemble des points de la forme a -F a, 
où a est un élément fixé de V et où x 
parcourt un sous-espace vectoriel F de E ; 
si F est de dimension finie p , on dit que V 
est de dimension p. 

Par analogie avec le cas des plans dans 
R\ on appelle hyperplan de E toute 
sous-variété linéaire qui n’est contenue 
strictement dans aucune autre variété 
linéaire que E lui-même ; par exemple, les 
hyperplans de R" sont les variétés linéaires 
de dimension n— 1 . Le complémentaire 
(ensembliste) d’un hyperplan H est la 
réunion (ensembliste) de deux ensembles 
convexes disjoints appelés les demi-espaces 
ouverts limités par H ; leurs réunions avec 
H s’appellent les demi-espaces fermés limi- 
tés par H. On dit que deux ensembles X et 
Y sont séparés par H si l’un est contenu 
dans un de ces deux demi-espaces fermés 
et l’autre dans l’autre demi-espace ; on dit 
que H est un hyperplan d’appui de X au 
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point x si x appartient à X et si X et x sont 
séparés par H. La figure 1 donne un 


fig. 1 



exemple d’un hyperplan H d’appui de X en 
jc, séparant X et Y (ici E = R 2 , et H est une 
droite). 

Ensembles convexes 

Un sous-ensemble C de E est dit convexe si 
pour tout couple x, y de points distincts de 
C, le segment [x, y] est entièrement contenu 
dans C (fig. 2). Il est clair que toute inter- 


fig. 2 




section d’ensembles convexes est encore un 
ensemble convexe. Par suite, si X est un 
sous-ensemble quelconque de E, l’intersec- 
tion X de tous les ensembles convexes 
contenant X (il y en a toujours au moins un, 
E lui-même) est un ensemble convexe 


contenant X qui possède la propriété d’être 
contenu dans tout ensemble convexe conte- 
nant X ; X s’appelle V enveloppe convexe de 
X (fig. 3). On peut aussi définir X comme 

j fig- 3 | 





l’ensemble de toutes les combinaisons 
convexes des points de X, c’est-à-dire 
l’ensemble des points de la forme : 

i 

où les Xj sont des points de X et où les À, 
sont des nombres réels positifs quelcon- 
ques de somme 1. On appelle enveloppe 
convexe fermée de X l’adhérence de X . 

Les enveloppes convexes des sous- 
ensembles finis de R" sont appelées des 
polytopes (cf. infra). En particulier, on 
appelle simplexe de dimension n l’enve- 
loppe convexe de {n -j- 1) points distincts 
de R" non situés dans un même hyperplan 
(segment pour n = 1 , triangle pour n = 2, 
tétraèdre pour n ~ 3, etc.) ; cette notion 
joue un rôle fondamental en topologie 
algébrique. 
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Un point x d’un ensemble convexe C est 
appelé un point extrémal si son complé- 
mentaire dans C est convexe, c’est-à-dire si 
x n’appartient à l’intérieur d’aucun seg- 
ment contenu dans C. Une face F de C est 
un sous-ensemble convexe de C tel 
qu’aucun segment contenu dans C ne 
traverse F, c’est-à-dire que tout segment 
[x, y] dont les extrémités appartiennent à C 
et dont un point différent des extrémités 
appartient à F est entièrement contenu 
dans F. Ainsi, le cube a six 2-faces, douze 
1-faces (les arêtes) et huit 0-faces (les 
sommets) ; de plus, le cube est l’enveloppe 
convexe de ses points extrémaux, qui sont 
ici les sommets. 

Les termes corps et cônes sont utilisés 
de manière assez différente par plusieurs 
auteurs. Nous adopterons les définitions 
suivantes : Un corps est un sous-ensemble 
borné de R" d’intérieur non vide (c’est-à- 
dire contenant au moins une boule de 
rayon > 0) et un cône est un sous- 
ensemble d’un espace affine réel E, qui est 
réunion d’une famille de demi-droites de 
même origine. 


2. Aspects quantitatifs 

Géométrie des nombres 

Ce sont des recherches de théorie des 
nombres qui furent à l’origine des premiers 
travaux de Minkowski. Nous renvoyons, 
pour cet aspect, à l’article approximations 
diophantiennes , en nous contentant de 
rappeler ici l’énoncé du célèbre théorème 
de Minkowski : Si C est un sous-ensemble 
convexe de R”, symétrique par rapport à 
l’origine, et de volume V(C) ^ 2", alors C 
contient au moins un point dont toutes les 
coordonnées sont des nombres entiers. 


Empilements 

Un empilement est un arrangement de 
corps convexes tel qu’aucune paire de ces 
corps n’ait de point intérieur en commun. 
Indépendamment de l’intérêt que les pro- 
blèmes d’empilements ont en eux-mêmes, 
ce genre de problèmes se retrouve égale- 
ment en théorie des nombres, en théorie de 
l’information, en cristallographie, en bota- 
nique, en construction des réacteurs 
nucléaires, etc. Très souvent, on cherche à 
réaliser un empilement de densité maxi- 
mum. Ainsi, l’empilement de densité maxi- 
mum de cercles égaux dans le plan est 
obtenu en décomposant le plan en hexa- 
gones réguliers égaux et en inscrivant dans 
chacun de ces hexagones le cercle de 
diamètre maximum ; ainsi, chaque cercle 
en touche exactement six autres (fig. 4). 


fig. 4 



Dans le cas de l’espace à trois dimensions, 
on a conjecturé que l’empilement de den- 
sité maximum de boules égales est obtenu 
par une construction due à Kepler : on 
commence par diviser R 3 en un échiquier 
à trois dimensions, où les cubes sont 
coloriés alternativement en blanc et en 
noir ; on construit ensuite des boules 
centrées en chacun des centres des cubes 
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noirs et tangentes à chacune des douze 
arêtes du cube ; de cette façon, chacune 
des boules en touche exactement douze 
autres. Cette conjecture n’a été démontrée 
que pour des empilements assez réguliers. 

Inégalités 

Il y a toute une série de résultats quanti- 
tatifs relatifs au volume, à la surface, au 
diamètre, etc., d’un corps convexe. Par 
exemple, Y inégalité isopé rimé trique 
exprime que la surface S et le volume V 
d’un corps convexe C de R" vérifient 
l’inégalité : 

S" ^ «coV" -1 , 

où (o est le volume de la boule unité de R" ; 
de plus, cette inégalité est une égalité si et 
seulement si C est une boule, c’est-à-dire 
que, parmi les corps convexes de volume 
donné, les boules constituent ceux dont la 
surface est minimum. De plus, tout corps 
convexe C de R" est contenu dans une 
boule de rayon minimum r , et cette boule 
est unique ; l’inégalité de Jung affirme que 
si on désigne par d le diamètre du corps C 
(c’est la borne supérieure des longueurs 
des segments dont les extrémités appar- 
tiennent à C), on a : 

r < (n/(2n + 2 ))' /2 d ; 

cette inégalité devient une égalité si et 
seulement si C est un simplexe régulier de 
n -|- 1 sommets dans R n . Un théorème de 
Loewner affirme que tout corps de R" 7 est 
contenu dans un ellipsoïde de volume 
minimum ; cet ellipsoïde joue un rôle 
important dans la théorie des modèles 
expérimentaux. 

Volumes mixtes 

Soit C b C 2 , C k des corps convexes de 
R", et A b À 2 , ..., X A . des nombres réels 


positifs ; l’ensemble des points de la 
forme : 

Apct + + - + ^k x k> 

où Xj parcourt C, pour tout i, est un 
corps convexe C, que nous désignerons 
par : 

XjCj -|- ... -I- ; 

lorsque C b ..., C k sont fixés, le volume 
de C s’exprime par un polynôme homo- 
gène de degré n en les variables A b ..., X A .. 
Certains des problèmes les plus fonda- 
mentaux de la théorie quantitative des 
corps convexes sont liés à l’étude des 
coefficients de ces polynômes, appelés 
volumes mixtes de C b ..., C k . L’outil de 
base, dans l’étude des volumes mixtes, est 
le théorème de Brunn-Minkowski, qui 
affirme que, pour tout X compris entre 0 et 
1, on a : 

[V((l -K) C, + XC 2 )]^ 

c’est-à-dire que la racine n- ième du volume 
est une fonction concave de X. Les inéga- 
lités pour les volumes mixtes engendrent 
de nombreuses inégalités d’intérêt géomé- 
trique, en particulier l’inégalité isopérimé- 
trique. 

Corps de largeur constante 

Un corps convexe C de R" est dit de 
largeur constante b si la distance entre 
n’importe quelle paire d’hyperplans 
d’appui de C parallèles est constante, égale 
à b. Contrairement à l’intuition, un tel 
corps n’est pas nécessairement circulaire 
(dans le plan) ou sphérique. La définition 
précédente équivaut à la suivante : C a 
pour diamètre b et tout ensemble réunion 
de C et d’un point quelconque de R 7 ' 
n’appartenant pas à C est de diamètre 
supérieur à b. Par suite, tout ensemble de 
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R" de diamètre < b est contenu dans un 
corps convexe de largeur constante b. 
Cette propriété permet, par exemple, de 
ramener le problème suivant de Borsuk au 
cas où X est de largeur constante : Peut-on 
recouvrir tout ensemble X de diamètre 1 
de R" par (n + 1) ensembles de diamètres 
< 1 ? La réponse est affirmative si n < 3, 
mais inconnue pour n > 3. 

Euler (en 1778) et de nombreux mathé- 
maticiens après lui ont étudié les corps 
convexes de largeur constante dans le plan 
{n — 2) ; les propriétés trouvées ont été 
utilisées en cinématique et même pour 
construire un foret utilisé pour forer des 
trous carrés : un corps possédant ces 
propriétés peut être placé dans un carré de 
telle sorte qu’en les tournant il reste 
perpétuellement en contact avec les quatre 
côtés de la boîte. 

3, Aspects combinatoires 

intersections 

Une partie des problèmes combinatoires 
est reliée à l’étude des intersections 
d’ensembles convexes qui sont toujours 
convexes, comme on l’a vu ci-dessus 
(l’ensemble vide est, par définition, 
convexe). 

D’après un théorème démontré par 
Helly. l’intersection C d’une famille de 
convexes de R", telle que l'intersection de 
toute sous-famille de (n -j- 1 ) de ces ensem- 
bles soit non vide, est non vide si l’une ou 
l'autre des hypothèses suivantes est réali- 
sée : la famille est finie ou chacun des 
convexes de la famille est fermé et borné 
(c’est-à-dire compact). Ce théorème admet 
de nombreuses généralisations et applica- 
tions. 

L’étude des propriétés des intersections 
d’ensembles convexes est facilitée par la 


notion de graphe d’intersection, qui est 
utilisée dans des domaines aussi variés que 
la génétique moléculaire, la psychologie et 
l’écologie. Pour toute famille d’ensembles, 
on appelle graphe d'intersection un graphe 
abstrait où chaque ensemble correspond à 
un sommet du graphe et où chaque inter- 
section non vide est représentée par un arc 
réunissant les sommets correspondants ; la 
figure 5 donne un exemple d’une famille 



d’ensembles convexes et de leur graphe 
d’intersection. Tout graphe ayant un nom- 
bre fini d’éléments est un graphe d’inter- 
section d’ensembles convexes de R\ mais 
pas nécessairement un graphe d’intersec- 
tion d’ensembles convexes de R 2 ou de R. 
Un graphe d'intervalles est un graphe 
d’intersection d’une famille finie d’ensem- 
bles convexes de R (ce sont des interval- 
les) ; on peut caractériser ces graphes 
d’intervalles, mais le problème correspon- 
dant pour le plan n’est pas résolu. 

Etude des enveloppes convexes 

Une autre série de problèmes combinatoi- 
res est la recherche de formes algébriques 
pour la représentation des enveloppes 
convexes. Voici, dans cet ordre d’idées, un 
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théorème très simple et très utile, dû à 
Carathéodory : Si X est un sous-ensemble 
de R" et u un point de l’enveloppe convexe 
de X, alors u appartient à l’enveloppe 
convexe d’un sous-ensemble fini Y de X 
contenant au plus (n 1) points. Par 
exemple, si X est un sous-ensemble du plan 
et si a' appartient à l’enveloppe convexe de 
X, alors x appartient soit à X, soit à un 
segment ayant pour extrémités deux points 
de X, soit à un triangle ayant pour sommet 
trois points de X. Le théorème de Cara- 
théodory a de nombreuses applications ; 
on en déduit, par exemple, que l’enveloppe 
convexe d’un ensemble fermé borné de R" 
est un ensemble fermé borné. 

Polyèdres 

Parmi tous les problèmes combinatoires 
que l’on rencontre dans la théorie de la 
convexité, celui qui est le plus ancien et qui 
a été étudié de la manière la plus approfon- 
die est la structure des faces des polyèdres 
convexes. Nous appellerons polyèdre tout 
sous-ensemble de R" intersection d’un 
nombre fini de demi-espaces fermés, en 
réservant la dénomination de polytope , aux 
polyèdres bornés ; un lemme, dû à Farkas, 
montre qu’un ensemble est un polytope si et 
seulement s’il est l’enveloppe convexe d’un 
nombre fini de points. On peut caractériser 
de même les cônes polyédraux comme 
enveloppes convexes d’un nombre fini de 
demi-droites de même origine. De manière 
générale, un sous-ensemble P de R" est un 
polyèdre si et seulement s’il satisfait à une 
des conditions équivalentes suivantes : 

a) P est un ensemble convexe fermé qui 
a un nombre fini de faces ; 

b) P est l’enveloppe d’un nombre fini 
de points et de demi-droites ; 

c) P est la somme vectorielle B + C 
d’un polytope B et d’un cône polyédral C, 


c’est-à-dire P est l’ensemble des points de 
la forme : 

x + y, x E B, y G C. 

d) P est l’enveloppe convexe fermée de 
la réunion d’un polytope B et du translaté 
d’un cône polyédral. (On a représenté, sur 
la figure 6, un polyèdre P de dimension 2, 


fig. 6 j 



ainsi que le polytope B et le cône C 
mentionnés ci-dessus.) 

Le premier résultat, dans l’étude com- 
binatoire des polytopes est le théorème 
d’Euler (1752), qui affirme que si v, e, f 
sont respectivement le nombre de som- 
mets, d’arêtes et de faces d’un polytope de 
dimension 3, on a : 

v~e + / = 2 

(on appelle ici sommets les points extré- 
maux du polyèdre). Poincaré et Schlâfli ont 

rû miv v> rt v\ a n /"I o 

£Wiiw tiiiais uiLuiCiiiL auÀ pOij' ivJpwo 

dimension n : si fi (P) est le nombre de faces 
de P de dimensions /, on a la relation : 

n — 1 

^ (-1)'/,(P) = 1 -(-!)"■ 

i = 0 

En 1934, Steinitz est parvenu à carac- 
tériser les graphes des polytopes de dimen- 
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sion 3 (on appelle graphe d’un polytope la 
structure combinatoire déterminée par les 
sommets et les arêtes) : le graphe d’un 
polytope de dimension 3 est équivalent à un 
graphe planaire (qui peut se dessiner dans 
le plan sans qu’il y ait aucune intersection 
d’arcs) connexe de degré 3 (c’est-à-dire qui 
ne peut être séparé en deux parties disjoin- 
tes en enlevant moins de trois sommets). 
Par exemple, le graphe de la figure 7 est le 


fig. 7 



graphe du polytope obtenu en tronquant 
chacun des sommets d’un cube ; les deux 
graphes de la figure 8 ne sont pas des 
graphes de polytopes de dimension 3, car le 



premier n’est pas connexe de degré 3 et le 
second n’est pas semblable à un graphe 
planaire (c’est le graphe d’un simplexe de 
dimension 4). On a découvert de nombreu- 
ses propriétés des graphes des polytopes de 
dimension n (par exemple, iis sont conne- 
xes de degré n), mais on ne connaît à ce jour 
aucune caractérisation combinatoire des 
graphes des polytopes de dimension > 3. 

De nombreux problèmes de program- 
mation linéaire et d’optimisation revien- 
nent à trouver les points d’un polyèdre P 
où une fonction linéaire atteint son mini- 
mum ; on montre que, si P est borné, le 
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minimum est alors atteint en un des 
sommets de P et certains procédés de 
résolution de programmes linéaires repo- 
sent sur cette propriété. On est donc 
amené à estimer le nombre de sommets 
d’un polytope P en fonction de sa dimen- 
sion et du nombre de faces de dimension 
(n — 1 ). Pour 2 ^ n < k, désignons par 
p(w, k) le nombre maximum de sommets 
que possède un polyèdre de dimension n 
qui a k faces de dimension (n — 1) et par 
(p(n, k) la somme des coefficients bino- 
miaux : 

cç(n, k ) = C*-" + CJ-* 

pour/? = k- [(«+ 1 )/2], q = k-[{n + 2)/ 
2], en désignant par [r] la partie entière de 
r, c’est-à-dire le plus grand entier < r; 
avec ces notations, on a alors : 

jj (n, k ) > <p {n, k ), 

et cette inégalité devient en fait une égalité 
si n < 8, ou k < n -j- 3, ou k ^ n 2 /4 (on 
ne sait s’il y a toujours égalité). L’étude de 
la fonction p montre, par exemple, le fait 
remarquable que pour tout k > n, il y a un 
polytope de dimension n à k sommets tel 
que chaque groupe de [n/2] sommets déter- 
mine une face : ainsi, il y a des polytopes de 
dimension 4 avec un nombre quelconque 
de sommets où chaque paire de sommets 
est reliée par une arête du polytope. 

4. Aspects qualitatifs 

Contrairement à ce qui précède, les espa- 
ces considérés ici sont quelconques, et non 
nécessairement de dimension finie. 

La convexité intervient de manière 
essentielle dans les espaces vectoriels de 
l’analyse : espaces vectoriels normés, ou 
plus généralement espaces vectoriels topo- 
logiques localement convexes, c’est-à-dire 


où tout point a un système fondamental de 
voisinages convexes ; on se limitera ici à de 
rapides indications, en renvoyant pour les 
définitions aux articles espaces vectoriels 
normés et espaces vectoriels topologi- 
ques. 

Espaces normés 

On soulignera seulement le rôle de la 
convexité. Rappelons qu’une norme sur un 
espace vectoriel E (qui sera ici réel) est une 
fonction p à valeurs positives définie dans 
E telle que : 

a) p(x) = 0 si et seulement si x = 0 ; 

b) p(kx) — | À | p(x) pour x G E et 
ÀGR; 

c) p(x + v) < p(x) + p(y) (sous-addi- 
tivité). 

Une norme est souvent notée ||.||. 

L’étude des espaces vectoriels normés 
est, d’une certaine façon, l’équivalent de 
l’étude d’une classe d’ensembles conve- 
xes ; le lien est établi par la fonction de 
jauge. Si || . || est une norme sur E, on 
appelle boule unité (resp. sphère unité ) 
pour cette norme l’ensemble des x G E tels 
que | A' | < (resp. ||.v|| = 1). Les propriétés 
de la norme entraînent que la boule unité 
U est un ensemble convexe dont l’inter- 
section avec toute droite passant par O est 
un segment symétrique [— a\ x] (non réduit 
au point O). Réciproquement, soit U un 
ensemble convexe satisfaisant à ces pro- 
priétés ; pour tout x ^ 0, désignons par 
p(x) le plus petit entier positif X tel que 
a/à G U et posons /?(0) = 0 (la fonction p 
est appelée la jauge de l’ensemble U). On 
vérifie facilement que la jauge de U est une 
norme sur E pour laquelle U est la boule 
unité (en fait, la jauge d’un ensemble peut 
se définir sous des hypothèses beaucoup 
plus générales). Ainsi toutes les propriétés 
d’un espace normé peuvent être décrites 
uniquement en fonction de sa boule ou 
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de sa sphère unité. Par exemple, la 
convexité stricte d’un espace vectoriel 
normé, caractérisée par l’inégalité stricte 
II* + .V II < ||*|| + 1 | lorsque * et y ne 
sont pas sur une même demi-droite d’ori- 
gine O, équivaut au fait que sa sphère unité 
ne contient aucun segment. 

On appelle espace de Minkowski tout 
espace vectoriel normé de dimension finie. 
Par exemple, pour tout r > 1 : 

ih-(2>|')“. 

i = 1 

où a* — (x i , x„) E R", est une norme sur 
R" ; pour r = 2, on retrouve la norme 
euclidienne usuelle. Une autre norme 
importante sur R" est la norme : 

H JC 1 « — SUD \Xf I , 

U I ^ n 

x = (a,, x„) E R", pour laquelle la 

boule unité est l’hypercube de R". 

Tous les problèmes quantitatifs indi- 
qués ci-dessus ont fait l’objet d’études 
analogues pour les espaces de Minkowski : 
inégalité isopérimétrique, inégalité de 
Jung, etc. 

Théorèmes de séparation 

En analyse fonctionnelle, en théorie des 
jeux, en intégration et même dans certains 
problèmes relatifs aux graphes coloriés en 
théorie des graphes, on utilise des théorè- 
mes de séparation et de support. 

Les théorèmes de séparation établissent 
les conditions sous lesquelles on peut 
séparer (au sens du chapitre 1) deux 
sous-ensembles convexes disjoints X et Y 
d’un espace vectoriel topologique E. Pour 
que cela soit possible, il suffit, par exemple, 
que l’une des conditions suivantes soit 
réalisée : 

a) E est de dimension finie ; 


b) un des deux ensembles a un intérieur 
non vide ; 

c) un des deux ensembles est fermé, 
l’autre compact, et E est localement 
convexe. 

Dans chacun de ces cas, on peut choisir 
l’hyperplan de séparation fermé, c’est-à- 
dire défini comme l’ensemble des zéros 
d’une fonction affine continue. 

Remarquant que l’intérieur d’un 
ensemble convexe est convexe, on en 
déduit que si A est un ensemble convexe 
d’intérieur non vide et A une sous-variété 
linéaire de E ne rencontrant pas l’intérieur 
de C, alors il existe un hyperplan qui 
contient A et qui sépare A de C (forme 
« géométrique » du théorème de Hahn- 
Banach). En particulier, si C est un ensem- 
ble convexe d’intérieur non vide, C admet 
un hyperplan d’appui en chaque point de 
sa frontière (théorème de Mazur). On ne 
peut pas étendre ce théorème au cas où C 
n’a pas de point intérieur, mais on peut 
montrer que, dans certains cas (C fermé 
dans un espace de Banach, ou C compact 
pour la topologie faible d’un espace loca- 
lement convexe), les points de la frontière 
de C, où C admet un hyperplan d’appui, 
forment un sous-ensemble dense de la 
frontière de C. 

Soit A une sous-variété linéaire d’un 
espace vectoriel E, p une fonction convexe 
dans E (cf. convexité - Fonctions conve- 
xes), et / une fonction affine définie dans 
A telle que f(x) < p(x) en tout point x de 
A ; alors il existe une fonction affine g 
définie dans E qui prolonge / (c’est-à-dire 
que g(x) = / (x) pour tout x E A) telle que 
l’on ait g(x) < p{x) en tout point x E E 
(théorème de Hahn-Banach). Ce résultat, 
essentiel en analyse fonctionnelle, équi- 
vaut en fait aux théorèmes énoncés ci-des- 
sus : il résulte, par exemple, du théorème 
de séparation en prenant pour ensembles 
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le graphe de la fonction / et l’épigraphe de 
la fonction p. D’autre part, ce théorème de 
Hahn-Banach entraîne que si C est un 
ensemble convexe contenant l’origine 
comme point intérieur et si u est un point 
frontière de C, alors C admet un hyper- 
plan d’appui en u (on retrouve le théorème 
de Mazur ; il faut prendre comme fonction 
convexe p la jauge de C). 

Points extrémaux 

Les fonctions convexes et concaves pré- 
sentent des propriétés très utiles dans les 
problèmes d’optimisation. Par exemple, 
soit / une fonction convexe définie dans un 
domaine convexe D d’un espace vectoriel 
topologique localement convexe E ; alors 
tout minimum local de / dans D est un 
minimum global , c’est-à-dire que si un 
point x 0 de D possède un voisinage U tel 
que f (x) ^ /(x 0 ) pour tout * <E U H D, 
alors cette inégalité est valable pour tout 
x G D. Si/ est concave et D compact, alors 
/ atteint son minimum en un point extré- 
mal de D ; cette propriété justifie l’étude 
des points extrémaux en analyse fonction- 
nelle. 

Le théorème de Krein-Milman attire 
l’attention sur d’autres propriétés impor- 
tantes des points extrémaux. Ce théorème 
établit que si C est un sous-ensemble 
compact convexe d’un espace localement 
convexe et si X est un sous-ensemble de C, 
alors C est l’enveloppe convexe fermée de 
X si et seulement si l’adhérence de X 
contient tous les points extrémaux de C ; 
ainsi, l’adhérence de l’ensemble des points 
extrémaux de C est le plus petit sous- 
ensemble X de C tel que chaque point de 
C soit adhérent à l’ensemble des combi- 
naisons convexes (cf. chap. 1 ) de points de 
X. On peut généraliser ce théorème au cas 
où C n’est pas compact moyennant des 
hypothèses supplémentaires ; par exemple, 


si C est un convexe fermé de R" ne 
contenant aucune droite, alors C est l’enve- 
loppe convexe de ses points extrémaux et 
de ses demi-droites extrémales (il n’est pas 
nécessaire de prendre l’enveloppe convexe 
fermée ; par définition, une demi-droite 
extrémale de C est une demi-droite qui 
n’est « traversée » par aucun segment 
contenu dans C). 

Voici une application du théorème de 
Krein-Milman à l’analyse fonctionnelle. 
Soit C un sous-ensemble compact convexe 
d’un espace localement convexe E et soit 
X l’ensemble de tous les points extrémaux ; 
alors, d’après le théorème de Krein- 
Milman, pour tout point p de C, il existe 
une mesure positive ju sur l’adhérence X de 
X telle que p(X) = 1 et telle que : 

/O) = J_/(*Mm(*) 

pour toute forme linéaire continue f(p) est 
le « barycentre » de la mesure p). Ce 
résultat entraîne de nombreux théorèmes 
de représentation intégrale en analyse. 

Théorèmes de point fixe 

Indiquons rapidement, pour conclure, 
deux théorèmes de point fixe pour les 
ensembles convexes. 

Le théorème de Brouwer-Schauder- 
Tychonov montre que si C est un compact 
convexe d’un espace localement convexe 
et / une application continue de C dans 
lui-même, il existe au moins un point p de 
C tel que f(p)=p. Ce théorème permet 
d'obtenir des théorèmes d’existence pour 
les solutions des équations différentielles et 
intégrales, les théorèmes du minimax en 
théorie des jeux et de nombreuses proprié- 
tés des ensembles convexes. Par exemple 
un compact C de R" ou d’un espace de 
Hilbert H est convexe si pour chaque point 
x de l’espace, il y a un point unique de C 
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qui minimise la distance entre x et C (pour 
R", il suffit que C soit fermé ; dans le cas 
d’un espace de Hilbert quelconque le 
problème n’est pas résolu). 

Le théorème de Markov-Kakutani 
affirme que si C est un compact convexe 
d’un espace vectoriel topologique et si 4> 
est une famille commutative de transfor- 
mations affines continues de C dans C, 
alors il y a au moins un point p de C tel que 
f (p) = p pour toute fonction de 4>. Ce 
théorème sert à établir l’existence de mesu- 
res invariantes pour les groupes commu- 
tatifs et à construire des mesures qui 
généralisent la mesure de Lebesgue pour 
les ensembles bornés de R". 

VICTOR KLEE 
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B. Fonctions convexes 

L'étude des fonctions convexes a permis 
de fournir un cadre dans lequel peut se 
résoudre toute une classe de problèmes 
d’analyse fonctionnelle non linéaire ; les 


problèmes ainsi abordés sont des questions 
d’optimisation provenant de divers domai- 
nes : la mécanique, l’économie, les équa- 
tions aux dérivées partielles, l’analyse 
numérique. Compte tenu de la difficulté 
d’aborder de manière un peu générale les 
problèmes non linéaires, c’est là un rôle 
très important qui a motivé le développe- 
ment autonome de la théorie. 

Les travaux de W. Fenchel, de T. Roc- 
kafellar, de J. -J. Moreau ont développé les 
outils de base de Y analyse convexe notam- 
ment la notion de fonctions convexes 
conjuguées et la notion de sous-différentiel 
qui sert de produit de remplacement poul- 
ies fonctions convexes non différentiables. 

Nous renvoyons à la partie A ci-dessus - 
Ensembles convexes, pour tout ce qui 
concerne les résultats généraux sur les 
convexes. 


1 . Les fonctions convexes 

Soit E un espace vectoriel sur R, C une 
partie convexe de E et/une fonction définie 
sur E à valeurs dans R (c’est-à-dire prenant 
éventuellement les valeurs ± oc). V épigra- 
phe de /, noté épi(/), est l'ensemble des 
couples (x, a) de C X R tels que/ (a ) < a. 
La fonction / sera dite convexe si son épi- 
graphe est une partie convexe de E X R. 

On obtient immédiatement une inter- 
prétation analytique de cette définition : La 
fonction f est convexe si et seulement si, 
pour tout réel À de l’intervalle [0, 1], on a : 

(1) fQ* + (1— m <\/C*) + (l— WOO 

pour tous les couples (x, y) d’éléments de 
C ne vérifiant pas /(.y) = — f(y) = ± » 
(auquel cas le second membre de l'inégalité 
(1) n’est pas défini). En raisonnant par 
récurrence, on prouve que, si À,, À 2 , A,, 
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sont des réels positifs dont la somme est 1, 
on a : 


( 2 ) 




*//(*/) 


chaque fois que le second membre de 
l’inégalité (2) a un sens. 

La possibilité pour la fonction / de 
prendre la valeur + oo permet de ne 
considérer que des fonctions convexes 
définies sur E tout entier ; en effet, si on 
prolonge la fonction / définie sur C en la 
fonction f définie sur E en posant 
f (a*) = + oo si x £ C, les fonctions / et / 
ont alors le même épigraphe et donc / est 
convexe si et seulement si f est convexe. 
Désormais, nous ne considérerons donc 
que des fonctions définies sur E tout entier. 
Cela nous conduit à définir le domaine 
effectif de f noté dom (f ) : 


dom (f) = G E ;/(*) < + 


Le domaine effectif de / est la projection 
sur E de l’épigraphe de /; c’est une partie 
convexe de E. 

La valeur — oo peut se présenter dans 
certains cas particuliers ; nous ne l’élimi- 
nons pas a priori ; néanmoins, nous intro- 
duisons la terminologie suivante : La fonc- 
tion convexe f est propre si son domaine 
effectif est non vide et si elle ne prend jamais 
la valeur — oo ; la restriction de/à dom (/) 
est alors une fonction à valeurs dans R (cf. 
la partie A ci-dessus - Ensembles conve- 
xes). Une fonction deux fois continûment 
différentiable sur un ouvert convexe C de 
R /? à valeurs réelles est convexe si et seule- 
ment si la matrice hessienne : 



est, en tout point a* de C, la matrice d’une 
forme quadratique positive. 


2. Cas de la dimension 1 

L’exemple des fonctions convexes définies 
sur R est instructif pour l’étude ultérieure 
des fonctions convexes définies sur R", ou 
même sur des espaces vectoriels topologi- 
ques. En outre, ce cas a un intérêt propre 
pour la définition d’une classe intéressante 
d’espaces : les espaces d’Orlicz. Dans tout 
ce chapitre 2, /est une fonction convexe 
propre définie sur R. 

Supposons que x 2 , a 3 soient dans 

dom(/) et vérifient x { ^ x 2 ^ x 3 ; en 
remarquant que : 



et en appliquant l’inégalité (1), on obtient 
les inégalités : 

(3) /frz)— /(* i) ^ /(* 3 ) — /(* l) 

X 2 X | ^ X 3 X ! 

< /(^3)-/(x 2 ) 
X 3 X 2 


c’est-à-dire que le coefficient directeur de la 
droite M,M 3 (cf. fig. 1) est compris entre 



celui de la droite MjM 2 et celui de la droite 
M 2 M 3 . En se servant de ces inégalités, on 
montre que /est continue sur l’intérieur de 
son domaine effectif. 
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L’utilisation des inégalités (3) permet de 
montrer que, en tout point intérieur à 
dom /, la fonction / admet une dérivée à 
droite f[ { (x) et une dérivée à gauche /^(x) 
et qu’on a, en outre, //x) < f' (i (x). De 
plus, / j (x) est croissante et continue à 
droite sur l’intérieur de dom / Si x 0 est un 
point intérieur à dom / tel que / (x 0 ) = 0, 
pour tout x intérieur à dom f on peut 
écrire : 

/(x) - \ x fAt)dt. 

0x o 



Les N-fonctions 

Considérons maintenant les fonctions 
convexes définies sur R à valeurs dans R 
et qui admettent une représentation de la 
forme : 

(4) /(*) = J/Vo*. 

où cp est une fonction définie sur [0, + oc[, 
croissante, continue à droite, nulle en 0, 
telle que : 

lim cp(jc ) = + oo et y(x ) > 0 pour x > 0 ; 


ces fonctions présentent un intérêt 
particulier pour la définition des espa- 
ces d’Orlicz ; ce sont les N-fonctions. 
Il s’agit, en fait, des fonctions convexes 
paires définies sur R à valeurs dans R 
strictement croissantes sur [0, + oo[, telles 
que : 


lim 

* — 0 


/(x) 

X 


= 0 


et lin, f Xl =+ « 

X 


Les N-fonctions vérifient, en outre, les 
inégalités (cf. fig. 2) : 

/ (ajc )<a/(x), sixERetO<a< 1, 
/(ax) < af{x), si x ^ 0 et 0 < a < 1, 


si <,<*,<*,. 

*1 *2 


Soit / une N-fonction exprimée sous la 
forme (4) ; posons : 

(5) 4 >(jc) = sup {« ; cp(a) < x }. 


Si cp est continue strictement crois- 
sante, ip est la fonction réciproque 
de cp (fig. 3). 



Remarquons qu’à un intervalle sur 
lequel cp est constante correspond un saut 
de la fonction tp et qu’à un saut de la 
fonction cp correspond un intervalle sur 
lequel ip est constante ; si l’on rajoute aux 
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courbes représentatives de cp et de ip les 
segments verticaux qui correspondent aux 
sauts des fonctions cp et ip (ce sont les seules 
discontinuités possibles puisque ces fonc- 
tions sont monotones), on obtient des 
courbes symétriques par rapport à la 
première bissectrice. Une démarche ana- 
logue effectuée sur la fonction ip redonne 
la fonction cp. 

Si, maintenant, on pose : 

g{x) = J W ip(0<*. 

on obtient une N-fonction appelée fonction 
conjuguée de la fonction f 

L’inégalité suivante, appelée inégalité 
de Young, dont la signification géométri- 
que obtenue en interprétant f (x) et g (y) 
comme des aires est suggérée sur la 
figure 4, a lieu ; 



(6) xy </(*) +#(>’)• 

L’égalité est atteinte lorsque x ^ 0 et 
y — cp (x) ; si bien que l’on a : 

M 9(1*1) =/(*) +s(<p(|*D) 

et qu’on a de même : 

\y\v(\y\) = g(y) +/(v(M))- 


Comme g(y) ^ xy —f (x) et que l’égalité a 
lieu pour au moins une valeur x 0 de x, on 
peut dire que : 

(7) g(y ) = max(xy— /(x)). 

X 

Cette inégalité a une interprétation 
géométrique simple en introduisant le 
point M d’abscisse x sur la droite D 
passant par l’origine de coefficient direc- 
teur y et le point N d’abscisse x sur la 
courbe représentative de g (cf. fig. 5) ; 



g(y ) = max NM = N 0 Mq. 

X 

Remarquons que, si f est dérivable, la 
tangente au graphe de/en N 0 est parallèle 
à la droite D et l’équation de cette tangente 
est t(x) — xy — g(y). La fonction g est la 
transformée de Legendre de / 

On peut aussi dire que la fonction 
/(x) — xy — g(y) est la plus grande fonc- 
tion affine de coefficient directeur y qui 
minore / 

Si p > 1 , la fonction / (x) = ^ | x | p est 
un exemple de N-fonction ; pour x > 0, on 
a /'(x) = x/ 7-1 et (/’ / ) _1 (x) = x (I ~\ où 
\/p + \/q = 1 ; par conséquent la fonc- 
tion g conjuguée de / est définie par 
g(x) = “ I -V f'. 
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Les espaces d'Orlicz 

Soit /une N-fonction, notons /l’ensemble 
des suites réelles (X) />0 telles qu’il existe 
a > 0 pour lequel : 


( 8 ) 


i'(ï) 


— < + 


lj est un sous-espace vectoriel de l’espace 
des suites que l’on munit d’une norme en 
posant : 


; = 0 1 = 0 


l’espace / est aussi l’espace des suites 
C v /)/>o tel que, P our t°ut a > 0, l’inéga- 
lité (8) ait lieu ; l f est alors un espace de 
Banach séparable ; son dual est isomorphe 
à l g , où g est la conjuguée de / grâce à 
l’isomorphisme : 

T 

où : 


Il (Xj)i > o II = inf{a > 0; ^/(“) < U. 

i' = 0 

Muni de cette norme, lf est un espace de 
Banach (cf. espaces vectoriels normés), 
appelé espace d’Orlicz de suites associé à 
la N-fonction /. 

On peut montrer que / est aussi 
l’ensemble des suites réelles (x f ) i>0 telles 
que : 

4- °° + °° 

sup 1 1 X ' y ^ ’ ^ ** 1 * < + °°’ 




(ydi; 


-+■ 00 

I 


yiX h 


où g est la fonction conjuguée de f 
On définit alors une autre norme sur / f 
en posant : 

III (*/),• >0 III = supdÿ^j ; ^g(Vi) < U. 

/=0 1=0 

Cette norme est équivalente à la pre- 
mière ; plus précisément : 

ll(*i)/>oK|||(*/)/ > olll<clc* 4 ), > ol- 

Lorsque / vérifie, en outre, la condition : 

(9) pour tout X > 1, il existe K > 0 et 
x >0 tels que f(Xx) < K/(x); 

ce qui se produit si et seulement si : 

*ûp(x) 

lim sup . < H- 

■* — * 0 + f(x ) 


L’application de ces considérations à la 
N-fonction / (x) = - ] x /, avec p > 1, 
donne pour espace d’Orlicz de suites 
l’espace l p . Une étude analogue peut être 
conduite dans le cadre de l’intégration, en 
définissant l’ensemble Lj (K) des fonctions 
jc(/), définies à un ensemble de mesure 
nulle près (cf. intégration et mesure), 
d’un compact K de R", à valeurs dans R 
telles qu’il existe a > 0 pour lequel on a : 

^f{x(t)/a)dt < + °°. 

Comme dans le cas des suites, L^K) est 
aussi l’ensemble des fonctions *(/) pour 
lesquelles : 


sup 


Jk Jk 




L^K) muni de l’une des deux normes 
équivalentes : 

|| JC (/ ) Il — inf{a ; J f(x(t)/a)dt < 1} 

ou : 

111^(0111 = sup {A | j^x(t)y(t)dî ; 


j K g(y(t))dt 


< il 
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est un espace de Banach appelé espace 
d’Orlicz de fonctions associé à la N-fonc- 
tion / 


3. Cas général 

Dans ce chapitre, E désigne l’espace R" 
ou, plus généralement, un espace vectoriel 
topologique séparé localement convexe 
sur R ; dans ce dernier cas, le dual 
topologique E* de E sera muni de la 
topologie faible r v (E) donnée par E et E 
sera muni de la topologie faible r v (E*) 
donnée par E*. 

11 ne faudrait pas croire que Ton peut, 
comme dans le cas des fonctions convexes 
de R dans R, conclure à la continuité des 
fonctions convexes de E dans R ; on 
dispose, en fait, du résultat suivant : 

Soit / une fonction convexe prenant une 
valeur finie en un point x de E ; s’il existe 
un voisinage de x sur lequel / est majorée 
par une constante finie, elle est continue au 
point x. 

Ce résultat permet, dans le cas particu- 
lier où E = R", d’établir que : 

Toute fonction convexe propre sur R" est 
continue sur l’intérieur de son domaine 
effectif ; en particulier, si / est à valeurs 
dans R, alors dom (/) = R" et / est 
continue sur R". 

Rappelons qu’une fonction / de E dans 
R est dite semi-continue inférieurement si, 
pour tout réel a , l’ensemble des éléments x 
de E tels que / (*) < a est fermé ; il est 
équivalent de dire que l’épigraphe de/ est 
fermé, ou encore que / est enveloppe 
supérieure d’une famille de fonctions 
continues, c’est-à-dire que : 

/ = sup/ u , 

a€a 

où f a est continue pour tout a E a. 


L’importance des hyperplans d’appui 
dans l’étude des ensembles convexes nous 
amène à introduire pour une fonction 
convexe / de E dans R la famille A ; des 
fonctions affines continues qui minorent/ 
Si on note T(E) l’ensemble des fonctions h 
de E dans R qui sont enveloppe supérieure 
d’une famille de fonctions affines conti- 
nues, le théorème de séparation (cf. chap. 4 
de la partie A ci-dessus - Ensembles 
convexes) permet de montrer que : 
L’ensemble h est élément de T(E) si et 
seulement si h est une fonction convexe 
propre semi-continue inférieurement ou 
vaut identiquement — oc. 

Pour une fonction /de E dans R, la plus 
grande fonction g de T(E) qui minore/ est 
aussi l’enveloppe supérieure des fonctions 
affines continues qui minorent / ; dans le 
cas où / est une fonction convexe et où A^ 
est non vide, g est aussi la plus grande 
fonction semi-continue inférieurement qui 
minore/ ; si bien que, lorsque / est de plus 
semi-continue inférieurement, /= g. 

Fonction conjuguée 
d'une fonction convexe 

L’inégalité de Young du chapitre 2 s’écrit 
xy — g(y) < / (.x), ce que l’on peut inter- 
préter en disant que la fonction affine 
l(x) = xy — g{} ? ) est une minorante de /; la 
fonction g(y) est choisie de telle sorte que 
/( x) soit la plus grande minorante affine de 
/ de coefficient directeur y. 

Si, maintenant, / est une fonction 
convexe de E dans R, de la même façon, 
pour tout x*G E*, introduisons la fonction 
affine l(x) = „v*(.v) — a et cherchons à 
déterminer si possible a, de manière à 
obtenir la plus grande minorante affine de 
/ de forme linéaire associée x* ; cela nous 
conduit à introduire : 

(10) /*(**) = su P (**(*) -/(*)). 
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Si f*(x*) G R, alors la fonction 
l(x) — x*(x) —J*(x*) est effectivement la 
plus grande minorante affine continue de 
forme linéaire associée x*. 

La formule (10) généralise la transfor- 
mation de Legendre (7) du chapitre 2 et 
permet de définir sur E* une fonction /* 
convexe qui est dans la classe T(E*) ; la 
fonction/* est, par définition, la fonction 
conjuguée de/ 

Remarquons que si la fonction f{x) est 
finie, de la formule (10) on tire l’inégalité 
de Young : 

( 11 ) f(x)+f*(x*)>x*{x) 

qui généralise l’inégalité (6) du chapitre 2. 

Recommençons maintenant le procédé 
en posant, pour tout x G E, 

/••(*) = sup (**(*) — /*(**)); 

x*€E* 

/** est alors le plus grand élément de T(E) 
qui minore /; donc, si fG T(E), alors 
/=/**. 


fig. 6 



de / ayant x* pour application linéaire 
associée est donnée par x*(z) — /*(x*), on 
en conclut que f*(x*) = x*(y 0 ) — / (x 0 ) ; 
en fait, cette égalité est une conditon 
nécessaire et suffisante pour que 
x* G ôf(x 0 ). 

Si / est dans T(E) (cas où / =/**), les 
propositions suivantes sont équivalentes : 


Sous-différentiel 

Soit / une fonction convexe de E dans 
R. Supposons qu’il existe un élément / de 
Ay (c’est-à-dire une minorante affine conti- 
nue de /) tel que l(x 0 ) = f(x 0 ) ; on dit alors 
que / est sous-différentiable en .v 0 ; l’appli- 
cation linéaire continue .y* associée à 
l’application affine / est un sous-gradient de 
/en x 0 ; l’ensemble des sous-gradients de / 
en x Q est appelé le sous-différentiel en x 0 de 
/ et est noté dj[x 0 ). 

Remarquons que, dans ces conditions, 
on a : 

l/(*o)l < + °°; l{z) =x*(z—x 0 ) +/(* 0 ); 

l’hyperplan H graphe dans E X R de 1 est 
un hyperplan d’appui du convexe épi(/) 
(fig. 6). Comme on a vu, par ailleurs, que 
la plus grande minorante affine continue 


(1) x*edf(x), 

(2) xGdf*(x*), 

(3) /(*)+/♦(* *)=**(*)> 

(4) /(*)+/*(**)-*♦(*)<(). 


Le sous-différentiel en x 0 d’une fonction 
convexe / est un sous-ensemble convexe 
fermé de E*. 

Le résultat suivant donne une condition 
intéressante de sous-différentiabilité d’une 
fonction convexe : 

Si / est finie et continue en un point x 0 ,/est 
sous-différentiable en tout point intérieur 
de dom(/) et en particulier en x 0 . 

Dans le cas où / est Gâteaux-différentiable 
en ,y 0 , c’est-à-dire s’il existe un élément 
/'(x 0 ) de E* tel que, pour tout> ? de E, on ait : 


lim 

x — * o 


/(■* o + *y)—f(x 0 ) 


=f'(xo)(y). 


148 


CORPS 


la fonction /est sous-différentiable en x 0 et 
f'(x Q ) est l’unique sous-gradient de / en x 0 . 
Réciproquement si, en x 0 , / est continue, 
sous-différentiable et ne possède qu’un seul 
sous-gradient x*, alors / est Gâteaux- 
différentiable en x 0 et f(x 0 ) = x*. 

Le sous-différentiel permet de remplacer la 
différentielle et d’exprimer notamment des 
conditions d’optimalité dans des problè- 
mes de contrôle. 

Donnons l’exemple de la fonction F, 
définie sur L 2 (Q), où Q est un ouvert de R" 
suffisamment régulier, par : 


+ o°, si »€ Wj’ 2 (ü) 


F (u)=h 


P Ÿ ôu{x) 

Jo 2^1 àXi 

i = i 


1 dx, si mGW>’ 2 (0) 


Wq’ 2 (Q) représente ici le sous-espace de 
l’espace de Sobolev W l ,2 (Q) constitué des 
u dont la restriction au bord de a est nulle. 
F est alors une fonction convexe semi- 
continue inférieurement, sous- 
différentiable en chaque point de 
WÔ ,2 (Ü) Pi W 2 2 (Q) ; pour chaque point u 
de ce sous-espace, le sous-différentiel dF(w) 
est constitué du seul élément : 


u* 


= — 2 


Z dhi 

d7}’ 


c’est-à-dire que, pour v G L 2 (Q), on a : 



i = 1 


Notons encore que, si /est une fonction 
convexe propre de T(E) pour tous les 
a,, x 2 , xf, xf vérifiant xf G ô /(.v,) et 
x* G df (x 2 ), on a : 

(*?“ **)(*!— *2) > 0* 

On dit que le sous-différentiel est un 
opérateur monotone ; il est même maximal 
monotone en ce sens que, pour tout 


couple(x, a*) tel que a* G df (a), il existe 
un couple (j\ y*) tel que : 

(y* — x*)iy — x) < 0. 

La théorie des opérateurs maximaux 
monotones, qui généralise l’analyse 
convexe, est très utile pour l’étude des 
équations d’évolution non linéaires de type 
parabolique ou hyperbolique. 

ROBERT ROLLAND 
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CORPS 


L a structure de corps n’est en fait qu’un 
cas particulier de la structure plus 
générale d’anneau (cf. anneaux et algè- 
bres) ; en plus des axiomes généraux, on 
stipule que le groupe multiplicatif des 
éléments inversibles est le complémentaire 
de 0. Les corps sont donc les domaines 
dans lesquels les opérations habituelles du 
calcul sont valables, y compris la division 
par un élément non nul. La terminologie 
habituelle sous-entend la commutativité de 
la multiplication, mais il s’introduit de 
manière naturelle des corps où la multi- 
plication n’est pas commutative (cf. Qua- 
t errtions, in anneaux et algèbres, chap. 2 
et infra , chap. 3). Du point de vue arith- 
métique, l’étude d’un corps commutatif se 
caractérise par l’absence d’idéaux non 
triviaux. 
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On se limitera ici à la théorie propre- 
ment algébrique des corps, mais on ren- 
contre aussi des corps munis de structures 
additionnelles compatibles avec la struc- 
ture de corps : les corps ordonnés, les corps 
topologiques et les corps valués (cf. algèbre 
topologique ; théorie des nombres - 
Nombres ^-adiques). 

Un sous-ensemble K d’un corps L qui 
est un corps pour l’addition et la multipli- 
cation induites est appelé un sous-corps de 
L. Pour ne prendre que des exemples bien 
connus, les nombres rationnels forment un 
sous-corps Q du corps R des nombres 
réels, qui est lui-même un sous-corps du 
corps C des nombres complexes. 

Si K apparaît comme sous-corps d’un 
corps L, on dit aussi que L est une 
extension de K. On peut alors considérer 
L comme un espace vectoriel à gauche sur 
K, l’opération externe n’étant autre que la 
multiplication à gauche des éléments de L 
par les éléments de K. Si cet espace 
vectoriel L est de dimension finie n sur K, 
on dit que L est une extension finie de K ; 
le nombre n s’appelle le degré de L sur K, 
et on le note [L : K]. Si M est une extension 
finie de L, c’est une extension finie de K et 
on a : 

[M : K] = [M : L][L : K]. 

Un homomorphisme / d’un corps K 
dans un corps L est un homomorphisme 
d’anneau, c’est-à-dire qui respecte les deux 
lois additive et multiplicative, avec la 
condition importante /(l) ~ 1. Un tel 
homomorphisme est nécessairement injec- 
tif car tout x^Oaun inverse x~\ d’où 
/( 1 ) = f (xx~ 1 ) = /(.Y)/ (x) 1 = 1 , d’où 
/ (.y) ^ 0 ; ainsi f identifie K à un sous- 
corps K' =/(K) de L et réalise ainsi L 
comme une extension de K. Si cette 
injection est une bijection,/ est un isomor- 
phisme. Les isomorphismes d’un corps K 


sur lui-même, ou automorphismes du corps 
K, jouent un rôle particulièrement impor- 
tant dans l’étude de la structure du corps 
(cf. Théorie de Galois). 


1 . Exemples 

Suffisamment « rigides » pour être maniés 
et étudiés précisément, les corps consti- 
tuent à la fois un modèle et un outil qui 
interviennent dans de nombreux domaines 
des mathématiques et dans des questions, 
même relativement élémentaires, de géo- 
métrie algébrique, analytique ou projective 
ou de théorie des nombres. Voici quelques 
exemples. 

Caractéristique d'un corps 
et corps finis 

L’intersection d’une famille de sous-corps 
d’un corps K est encore un corps. Consi- 
dérant en particulier la famille de tous les 
sous-corps de K, on obtient le plus petit 
sous-corps de K, appelé sous-corps premier 
K 0 de K. Notant n. 1 la somme de n 
exemplaires de 1, pour tout entier naturel 
n , on définit la caractéristique (cf. anneaux 
ET ALGÈBRES, chap. 3). 

SinA ^ 0 pour n =£ 0, on dit que K est 
de caractéristique nulle. Les nA et — (/?.l) 
pour « G N forment donc un sous-anneau 
de K isomorphe à l’anneau Z des entiers 
relatifs et le corps K 0 est isomorphe au 
corps Q des nombres rationnels. Le 
corps K est donc une extension du corps 
des nombres rationnels. 

Dans le cas contraire, la caractéristique 
de K est le plus petit entier strictement 
positif tel que pA =0. C’est un nombre 
premier et le corps K 0 est alors isomorphe 
au corps fini = Z/pZ des entiers relatifs 
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modulo p (cf. ANNEAUX ET ALGEBRES, 
chap. 3). Ainsi, tout corps de caractéristi- 
que p est une extension du corps et deux 
corps de caractéristiques différentes ne 
peuvent être extension l’un de l’autre. 

Soit K un corps fini. Un théorème dû à 
J. H. M. Wedderburn affirme qu’un tel 
corps est nécessairement commutatif. La 
caractéristique de K est nécessairement un 
nombre premier p et K est une extension 
finie du corps premier F p . Si n = [K : F p ], 
alors K est isomorphe à (F^)" comme 
espace vectoriel sur F /; et il a donc p n 
éléments. On verra ci-dessous que pour 
tout entier de la forme p n , avec n premier, 
il existe un corps (unique à un isomor- 
phisme près) possédant p n éléments ; on le 
note F n. 

Corps de nombres 

Le corps C des nombres complexes est un 
exemple bien classique de corps. Les 
sous-corps de C forment une vaste famille 
à laquelle appartiennent le corps Q des 
nombres rationnels (qui est le plus petit) et 
le corps R des nombres réels. Les corps de 
nombres algébriques présentent un intérêt 
tout particulier. Dedekind en donne la 
description suivante : Soit x un nombre 
complexe algébrique, c’est-à-dire une 
racine d’une équation P(X) = 0, où P(X) 
est un polynôme à coefficients entiers, de 
degré n irréductible sur le corps Q ; alors 
l’ensemble Q(x) des nombres complexes 
de la forme : 

a 0 + a^x + ... 4- a n _ l x n ~ l , 

où les cij sont des nombres rationnels 
quelconques, est un corps. De la définition, 
il résulte que Q(x) est un espace vectoriel 
sur Q de dimension finie n. Inversement, 
on peut montrer que toute extension finie 
de Q est isomorphe à une extension de la 
forme précitée Q(x). Si bien que l’on peut 


définir abstraitement les corps de nombres 
algébriques comme des extensions finies de 
Q. Ainsi, si, dans l’anneau Q[X] des 
polynômes à coefficients rationnels, on 
identifie deux polynômes R(X) et R'(X) 
dont la différence est un multiple d’un 
polynôme P(X), à coefficients entiers, de 
degré «, irréductible sur Q, on obtient, sur 
l’ensemble quotient Q[X]/P(X) muni de 
l’addition et de la multiplication induites 
par celles des polynômes, une structure de 
corps qui en fait une extension finie de 
degré n de Q. En choisissant une racine x 
de l’équation P(X) = 0 dans le corps des 
nombres complexes, on peut expliciter un 
isomorphisme de Q[X]/(P(X)) sur Q(x) 
défini précédemment : à un polynôme 
R(X) on associe sa valeur R(x) en x et, 
comme deux polynômes congrus modulo 
P(X) ont même valeur en x, cela définit un 
homomorphisme : 

J : Q[X]/(P(X)) —*• Q(x), 

qui est l’isomorphisme annoncé. La der- 
nière définition des corps de nombres 
algébriques, qui est, au langage près, celle 
de Kronecker, est ainsi reliée à celle de 
Dedekind. 

Corps de restes 

Le procédé de Kronecker pour définir les 
corps de nombres algébriques peut être 
présenté dans un contexte plus général. Un 
idéal m d’un anneau commutatif unitaire A 
est appelé idéal maximal s’il n’est contenu 
strictement dans aucun autre idéal que A 
lui-même. L’anneau quotient A /m ne pos- 
sède alors aucun idéal autre que 0 et A /m, 
car de tels idéaux sont en correspondance 
biunivoque avec les idéaux de A qui 
contiennent m. Tout élément non nul x de 
A/m engendre donc A/m tout entier ; il en 
résulte qu’il existe un élément x -1 de A/m 
tel que xx 1 — 1 et que l’anneau unitaire 
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A/m est en fait un corps, le corps des restes 
de A modulo ni. 

Nous avons déjà appliqué ce résultat au 
plus simple de tous les anneaux unitaires : 
l’anneau Z des entiers relatifs. Les idéaux 
maximaux de Z sont les idéaux pTL engen- 
drés par un nombre premier p et le corps 
des restes = Z/pZ possède p éléments. 
Nous avons ici un premier exemple de 
corps à un nombre fini d’éléments, ou 
corps finis. Nous reviendrons sur ces corps 
(parfois appelés champs de Galois dans la 
vieille littérature), dont l’importance est 
essentielle en théorie des nombres. 

Dans l’anneau K[X] des polynômes à 
une variable sur un corps commutatif K, 
un idéal est maximal si, et seulement si, il 
est engendré par un polynôme irréductible 
non constant P(X). Les classes de polynô- 
mes modulo P(X) forment donc un corps 
K[X]/(P(X)). C’est ainsi que le corps des 
nombres complexes peut être défini, avec 
Cauchy, comme le corps de restes 
R[X]/(X 2 + 1). Si K = Q, on retrouve les 
corps de nombres algébriques de Kronec- 
ker. 

Corps de fractions 

Tout corps possède la propriété que le 
produit de deux éléments non nuis est 
lui-même non nul ; il en est de même de 
tout sous-anneau (c’est-à-dire de tout sous- 
ensemble du corps qui, pour l’addition et 
la multiplication induites, est un anneau). 
Un anneau possédant une telle propriété 
est appelé un anneau intègre. La construc- 
tion des nombres rationnels à partir des 
entiers relatifs suggère un moyen de consi- 
dérer tout anneau commutatif intègre A 
comme un sous-anneau d’un corps K. On 
considère d’abord, sur A X (A — (0)), les 
lois de composition : 

(a,b) + (a’, b') = (< ab ' + ba',bb'), 
(a,b)(a',b' ) — (aa’,bb’). 


puis on vérifie que la relation d’équiva- 
lence fit, définie sur A X (A-{0}) par 
{afi)3i (a fi'), lorsque ab ' = ba\ est com- 
patible avec ces lois de composition et que 
le quotient K est un corps : l’unité est la 
classe de (a, a), et l’inverse de la classe de 
(a fi) existe dès que a n’est pas nul et n’est 
autre que la classe de ( b,a ). 

Il est d’usage de noter a/b la classe d’un 
couple (afi). L’anneau A s’identifie alors 
au sous-anneau de K formé des classes du 
type a/l. Il est à remarquer que cette 
construction est « universelle » : chaque 
fois que A sera obtenu comme sous-anneau 
d’un corps K', le corps K' pourra être 
considéré comme extension du corps K. 
On dit que K est le corps des fractions de A. 

Nous allons appliquer ce qui précède à 
deux importants cas particuliers. Si K est 
un corps commutatif, l’anneau K[X] des 
polynômes : 

P(X)-a 0 + û 1 X + ... +a„X» f 

à coefficients dans K est intègre. Il est alors 
possible de former le corps des fractions de 
K[X], noté K(X), et dont les éléments 
P(X)/Q(X), où P(X) et Q(X) sont deux 
polynômes, sont appelés fractions ration- 
nelles sur K. Il est facile de généraliser cela 
au cas de plusieurs variables : on obtient 
alors le corps K^Xj, X 2 , X„) des frac- 
tions rationnelles à n variables indétermi- 
nées comme corps des fractions de 
l’anneau intègre K[X,, X 2 , ...., XJ des 
polynômes à n variables. 

De même, l’anneau des séries formelles 
entières : 

S(X) = a □ 4- a ( X + ... + a n X. n + 

à coefficients dans K (cf. anneaux et 
algèbres), que l’on note habituellement 
K[[X]], est intègre. 11 est donc de nouveau 
possible de former le corps K((X)) des 
fractions de K[[X]]. Si l’on remarque que 
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les séries formelles entières dont le terme 
constant a 0 n’est pas nul sont inversibles 
dans K[[X]], on voit que toute série for- 
melle entière non nulle peut se mettre, 
d’une façon unique, sous la forme X” S(X), 
où S(X) est une série formelle entière 
inversible. Pour construire le corps K((X)), 
il suffit donc de savoir effectuer la division 
par les monômes X". Il en résulte immé- 
diatement que le corps K((X)) peut être 
décrit comme l’ensemble des séries formel- 
les : 

S(X)= 


(où la notation n » — oo signifie que, pour 
n inférieur à un certain entier relatif n{ S), 
on a a n = 0) muni des lois d’addition et de 
multiplication qui prolongent celles des 
séries formelles entières : 


X" 1 ) + 

j ’ 




= > <a r + b r )X r , 


Z fl ” xm MZ é ” x ")=5> x ' 


où c r 




Corps de fonctions algébriques 

La géométrie algébrique fournit de nom- 
breux exemples de corps. Nous nous limi- 
terons ici à des indications élémentaires. 

Une sous-variété algébrique affine de 
l’espace vectoriel C" des suites 
(x u x 2 , x n ) de n nombres complexes est 
définie comme l’ensemble V des points 
(fl,, a 2 , a n ) de C" qui vérifient un certain 
nombre d’équations : 

P = 0, 


P r(a\,a 2t = 0 , 


où les P,(Xj, X 2 , X„) sont des polynô- 
mes à coefficients complexes. Un poly- 
nôme S(X 1 ,X 2v ..,X„) à coefficients com- 
plexes définit une fonction à valeurs 
complexes sur C n et, par restriction, sur V. 
On considérera comme équivalents deux 
polynômes qui prennent la même valeur 
aux points de V. L’ensemble des classes 
d’équivalence, noté C[V], est muni d’une 
addition et d’une multiplication, déduites 
de celles des polynômes, qui en font un 
anneau, et ses éléments peuvent être consi- 
dérés comme des fonctions sur V à valeurs 
complexes. 

Si V n’est pas la réunion de deux 
sous-variétés V' et V" distinctes d’elle- 
même, on dit qu’elle est irréductible. Dans 
ce cas, l’anneau C[V] est intègre, et le corps 
des fractions, qui est noté C(V), peut être 
vu comme un corps de fonctions sur V, à 
valeurs dans la droite projective complexe 
(ensemble obtenu par l’adjonction à C 
d’un point « à l’infini »). Les éléments de 
C( V) sont appelés des fonctions algébriques 
sur V. 

2. Théorie élémentaire 
des corps commutatifs 

Adjonction, extensions simples 

Soit L un corps et K un sous-corps de L. 
Pour tout sous-ensemble S de L, l’inter- 
section des sous-corps de L qui contien- 
nent K et S est un sous-corps de L, que l’on 
appelle le sous-corps obtenu par adjonction 
de S à K, et que l’on note K(S). Si 
K (S) = L, on dit que S est un système de 
générateurs de L sur K. Un cas particulier 
important est celui où S est réduit à un seul 
élément .v : l’extension obtenue est notée 
K(x), et on dit que c’est une extension 
simple de K. En effet, toute extension L 
d’un corps K peut être obtenue par adjonc- 
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tions « répétées » d’un élément (lorsque L 
possède un système S fini ou dénombrable 
de générateurs, l’expression « répétées » a 
le sens classique ; pour la définir dans le cas 
général, il faut faire une récurrence trans- 
finie après avoir muni S d’un bon ordre, ce 
qu’autorise l’axiome de Zermelo). 

Soit L une extension simple d’un corps 
K, et soit x un générateur, c’est-à-dire que 
L = K(x). On peut faire un raisonnement 
tout à fait parallèle à celui qui a été fait à 
propos de la caractéristique. En effet, deux 
cas se présentent : 

- Les monômes x n sont linéairement indé- 
pendants sur K, c’est-à-dire qu’une rela- 
tion telle que : 

a 0 + a x x -f- a 2 x 2 + ... + a n x n ~ 0, 

avec les a t dans K, n’est possible que si 
a 0 = a ] = a 2 = ... = a n = 0. Le corps 
K(x) est alors isomorphe au corps K(X) 
des fractions rationnelles sur K. On dit que 
x est transcendant et que K(x) est une 
extension transcendante simple de K. Evi- 
demment, tout élément y de K(x) qui 
n’appartient pas à K est transcendant sur 
K et on a KO/) — K(x). Les exemples 
classiques de nombres transcendants sur Q 
sont ceux de e = 2,718 28..., base des 
logarithmes népériens, et 7r = 3,141 59..., 
rapport de la circonférence d’un arc à son 
diamètre (cf. nombres transcendants). 

Il existe un polynôme non constant, que 
l’on peut supposer irréductible, P(X), à 
coefficients dans K tel que P(x) = 0. Le 
corps K(x) est alors isomorphe au corps de 
restes K[X]/(P(X)). On dit que x est 
algébrique sur K et que K(x) est une 
extension algébrique simple de K. Si le 
polynôme P(X), que l'on appelle polynôme 
minimal de x, est de degré n , alors (1, x, 
x 2 , ..., x"- 1 ) est une base de K(x) sur K et 
on a donc [K(x) : K] = n. 


Extensions algébriques, 
bases de transcendance 

On peut généraliser ce qui vient d’être dit 
au précédent paragraphe. Un élément x 
d’une extension L d’un corps K est algé- 
brique s’il vérifie une équation algébrique 
à coefficients dans K : 

+ ... + a x x +a 0 = 0, 

ou, en d’autres termes, si l’extension sim- 
ple K(x) de K est algébrique. Si tous les 
éléments de L sont algébriques sur K, on 
dit que L est une extension algébrique de K. 
Ainsi en est-il d’une extension algébrique 
simple. On peut montrer facilement que 
toute extension algébrique engendrée par 
un nombre fini d’éléments est finie. La 
réciproque étant claire, il n’y a pas lieu de 
distinguer les extensions finies de celles que 
l’on appelle parfois extensions algébriques 
finies. 

Revenons maintenant au cas général 
d’une extension quelconque L d’un corps 

K. Un sous-ensemble S de L est algébrique- 

ment indépendant sur K, par définition, si, 
pour tout sous-ensemble fini ..., s n ) 

de S, il n’existe aucun polynôme à coeffi- 
cients dans K non nul P(X t , X 2 , ..., X„), tel 
que P (5j, s 2 , ..., s n ) = 0. Le corps 

K ($!, s 2 , ..., s J engendré sur K par les s f est 
alors isomorphe au corps des fractions 
rationnelles à n variables sur K, 
K( X i , X 2 , . . . , X„ ). Une base de transcen- 
dance de L sur K est un sous-ensemble T de 

L, algébriquement indépendant sur K, et tel 
que L soit une extension algébrique de 
K(T). On démontre qu’il existe toujours de 
telles bases de transcendance et que deux 
bases quelconques ont le même nombre 
d’éléments ; on appelle ce nombre le degré 
de transcendance de L sur K. Une extension 
est algébrique si, et seulement si, son degré 
de transcendance est nul. 
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Nous avons parlé plus haut du corps 
C(V) des fonctions algébriques rationnel- 
les sur une sous-variété algébrique V de C' 7 . 
Le degré de transcendance de C(V) sur C 
est égal à la dimension de V considérée 
comme variété analytique complexe 
(dimension elle-même égale à la moitié de 
la dimension de V considérée comme 
variété différentiable, mais cela est une 
autre histoire !). En particulier, si V est une 
courbe, le degré de transcendance est 1. 
On appelle parfois une extension de degré 
de transcendance 1 de C, et plus généra- 
lement d’un corps K, un corps de fonctions 
sur K. 

Corps algébriquement clos, 
clôture algébrique, corps de rupture 

Une équation algébrique à coefficients 
dans un corps K n’admet pas nécessaire- 
ment de racine dans K. Ainsi, l’équation à 
coefficients réels X 2 -j- 1 = 0 n’a pas de 
racine réelle. De même, dans Z/2Z, le 
polynôme X 2 -f- X + 1 prend la valeur 1 
sur les deux éléments 0 et 1 et n’a donc 
aucun zéro. Si un corps K est tel que tout 
polynôme à coefficients dans K admette 
une racine dans K, on dit qu’il est algé- 
briquement clos . Un tel corps ne saurait 
avoir d’extension algébrique propre ; 
inversement, un corps qui n’admet pas 
d’extension algébrique propre est algébri- 
quement clos. Dans un corps algébrique- 
ment clos, un polynôme non constant se 
décompose en un produit de facteurs 
(irréductibles) du premier degré. Un théo- 
rème, démontré par Gauss (cf. nombres 
complexes), montre que le corps C des 
nombres complexes est algébriquement 
clos. Le mathématicien allemand Steinitz, 
qui a exposé vers 1910 une nouvelle théorie 
des corps commutatifs, a démontré que 
tout corps K admettait au moins une 


extension K qui soit algébrique sur K et 
algébriquement close. On appelle une telle 
extension une clôture algébrique de K. Si 
Kj et K 2 sont deux clôtures algébriques de 
K, il existe un isomorphisme de K| sur 
K 2 qui laisse fixe chaque élément du 
sous-corps K, si bien que, dans la pratique, 
on ne les distingue pas. Le corps C est 
algébrique sur R et est donc une clôture 
algébrique de R ; mais ce n’est pas une 
clôture algébrique de Q, car des éléments 
tels que 7r et e sont transcendants sur Q. Le 
sous-corps Q de C, formé par l’ensemble 
des nombres complexes algébriques sur Q, 
est algébriquement clos, et, comme, par 
définition, il est algébrique sur Q, il en est 
une clôture algébrique. 

Pour le corps fini F^, on a : 

OÙ: = [x G ¥ p \ xP n — x = 0} 

(cf. Théorie de Galois). 

On connaît aussi la structure de la 
clôture algébrique du corps K((X)) des 
séries formelles à coefficients dans un 
corps K algébriquement clos de caracté- 
ristique nulle. Elle s’obtient par une 
méthode analogue à F p . On a : 

K((X)) = U K((X 1/n )), 

où K((X 1/w )) est l’extension de degré n de 
K((X)) obtenue en adjoignant les racines 
de l’équation algébrique T' 7 — X = 0. Ces 
corps sont appelés corps de Puiseux. 

Etant donné un corps K, K une clôture 
algébrique de K, les racines dans K. d’un 
polynôme P(X) à coefficients dans K 
engendrent sur K un corps K P . Tout corps 
dans lequel P(X) se décompose en facteurs 
du premier degré peut être considéré 
comme une extension de K P : on dit que 
iC P est un corps de rupture pour le poly- 
nôme P(X). Comme le corps K P est 
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engendré par un nombre fini d’éléments 
algébriques sur K, c’est une extension finie 
de K. 

Automorphismes, extensions normales, 
groupes de Galois 

Un K-automorphisme d’une extension L 
d’un corps K est un automorphisme a du 
corps L tel que, pour tout x dans K, on ait 
x a — x (nous utilisons la notation expo- 
nentielle, et le composé gt de deux auto- 
morphismes a et r est défini par 
y ar = (v ,(7 ) T ). Ainsi, tout automorphisme 
d’un corps K est un K 0 -automorphisme, 
K 0 étant le sous-corps premier de K. On 
notera G(L/K) le groupe des 
K-automorphismes d’une extension L d’un 
corps K. Pour tout sous-groupe H de 
G(L/K), on peut considérer l’ensemble L H 
des éléments de L laissés fixes par tout 
automorphisme appartenant à H. Il est 
immédiat que L H est un corps qui contient 
K. On l’appelle le corps des invariants de H. 
Voici deux exemples de cette situation : 

- La conjugaison complexe o qui, à tout 
nombre x — a -\- ib de C, associe le nom- 
bre x — a — ib , est un automorphisme du 
corps C. Le groupe H d’automorphismes 
de C formé par a et l’identité admet R 
pour corps des invariants. 

- Dans un corps K de caractéristique p 
non nulle, l’application cp de K dans K qui, 
à tout élément a , associe sa puissance 
/>-ième x p est un endomorphisme du corps, 
que l’on appelle endomorphisme de Fro- 
benius. Le seul point non trivial à vérifier 
est que : 

(. x — y )p = XP — y P ; 

mais cela résulte du fait que dans la 
formule du binôme, les coefficients non 
extrêmes sont divisibles par p puisque p est 
premier. Lorsque cet endomorphisme est 
un automorphisme, ce qui est le cas poul- 


ies corps finis, on dit que le corps K est 
parfait . On peut alors chercher quels sont 
les invariants dans K pour le groupe 
d’automorphismes H engendré par cp : ce 
sont les racines de l’équation 
X p — X = 0 ; il y en a donc au plus /?, et 
K H n’est autre que le sous-corps premier 
K 0 , qui est isomorphe au corps à p 
éléments Z/pZ. 

Il est clair que les K-automorphismes 
d’un corps L respectent le caractère de 
transcendance ou d’algébricité sur K des 
éléments de L. Le dernier point peut être 
précisé : si a est racine d’une équation 
algébrique : 

a n x n + a n _ x x n ~ x + ... + a x x + a 0 — 0 

irréductible sur K, on a, en posant y = a g , 
g E G(L/K) : 

a n y n + a n _ x y n ~ x + ... + a x y + a 0 
- (a n x n +a n _ x x"-' +... + a x x+a 0 ) a = 0 ° = 0 , 

si bien que x et son transformé a 0 ont 
même polynôme minimal (deux éléments 
algébriques de L qui sont dans ce cas sont 
dits conjugués sur K). 

Une extension algébrique normale L 
d’un corps K est, par définition, une 
extension algébrique dans laquelle le poly- 
nôme minimal de tout élément x se décom- 
pose en facteurs du premier degré (en 
d’autres termes, L contient tous les conju- 
gués de x dans une clôture algébrique L de 
L). Il est évident qu’un corps de rupture 
sur un corps K d’un polynôme P(X) à 
coefficients dans K est une extension 
algébrique normale de K. Le groupe 
G(L/K) d’une extension algébrique nor- 
male L d’un corps K, que l’on appelle alors 
le groupe de Galois de l’extension, opère 
transitivement dans toute classe d’élé- 
ments conjugués, c’est-à-dire que, si x et y 
sont deux éléments conjugués, il existe 
g E G(L/K) tel que y — x°. Lorsque L est 
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le corps de rupture sur K d’un polynôme 
P(X) à coefficients dans K, le groupe 
G(L/K) est parfois nommé groupe de 
l équation P(X) = 0. 

À titre d’exemple, remarquons que le 
corps (^(VT) n’est pas une extension 
normale de Q : en effet, a — VT a deux 
conjugés aj et a/, où j et / sont les racines 
cubiques non réelles de l’unité. Le corps 
Q(a,y) obtenu par adjonction de j à Q(a) 
est un corps de rupture de P(X) = X 3 — 2, 
le polynôme minimal de a, et c’est aussi 
la plus petite extension de Q(a) normale 
sur Q. 

Théorie de Galois 

Jusqu’à Abel et Galois, le problème cen- 
tral posé par les équations algébriques 
était celui de leur solution par radicaux, 
c’est-à-dire l’expression des racines au 
moyen d’opérations rationnelles et 
d’extractions de racines (cf. équations 
algébriques). Les Grecs connaissaient 
déjà des cas particuliers de la formule 
x — (— b ± V b 2 — 4ac)/(2a) pour la solu- 
tion de l'équation du second degré 
ax 1 + bx + c = 0, et de semblables for- 
mules avaient été trouvées pour les équa- 
tions du troisième et quatrième degré par 
J. Cardano, N. Tartaglia et L. Ferrari. Les 
échecs répétés pour parvenir à une solu- 
tion dans le cas de l’équation du cinquième 
degré amenèrent Lagrange (1770) à exa- 
miner avec plus de profondeur ce qui 
permettait d’arriver au but jusqu’au degré 
4. C’est ainsi qu’il fut conduit à mettre en 
évidence certaines fonctions rationnelles 
des racines qui restaient invariantes par 
certaines substitutions effectuées sur celles- 
ci : les résolvantes qui portent son nom. 
Mais ce ne sera qu’avec Abel, et surtout 
Galois (1832), que l’on considérera les 
fonctions rationnelles des racines d’une 
équation polynomiale P(X) = 0 et les 


opérations d’addition et de multiplication 
sur celles-ci. De plus, Galois sut dégager un 
sous-groupe significatif du groupe de tou- 
tes les permutations des racines de l’équa- 
tion, le groupe de l’équation, et lire sur ce 
groupe, entre autres choses, la possibilité 
ou l’impossibilité de résoudre l’équation 
par radicaux. Son résultat avait pour 
corollaire le théorème pressenti par Ruffini 
puis démontré par Abel : l’équation géné- 
rale du cinquième degré n’est pas résoluble 
par radicaux. C’est Dedekind, qui a, 
comme nous l’avons déjà dit, introduit le 
terme de corps (pour les corps de nombres 
algébriques), et c’est lui encore qui a 
présenté le groupe d’une équation comme 
un groupe d’automorphismes de corps. 

Exposés en un langage moderne, les 
résultats de Galois concernent une exten- 
sion finie, normale et séparable (une exten- 
sion algébrique est dite séparable si le 
polynôme minimal d’un élément quelcon- 
que n’a pas de racines multiples : toutes les 
extensions algébriques d’un corps de 
caractéristique 0 ou d’un corps parfait sont 
séparables). Dans la suite, nous dirons 
qu’une telle extension est galoisienne . 

Le premier théorème précise la défini- 
tion des extensions galoisiennes ; une 
extension finie L d’un corps K, de degré n , 
est galoisienne si, et seulement si, le corps 
L G des invariants du groupe de Galois 
G= G(L/K) est réduit à K ; dans ce cas. 
le groupe de Galois G est d’ordre n. 

Le deuxième théorème a trait à ce qu’on 
appelle la correspondance de Galois. Une 
extension galoisienne L d’un corps K étant 
donnée, l’application de l’ensemble des 
sous-groupes du groupe de Galois G(L/K) 
dans l'ensemble des sous-corps de L qui 
contiennent K, qui, à un sous-groupe H de 
G(L/K), associe le corps des invariants L H , 
est bijective. L’application inverse peut 
être décrite ainsi : si M est un sous-corps 
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de L qui contient K, l’extension L du corps 
M est encore normale et séparable, donc 
galoisienne ; son groupe de Galois 
G(L/M) est un sous-groupe du groupe 
G(L/K), et l’application M ► G(L/M) est 
inverse de l’application H ► L H . De plus, 
un sous-corps M de L qui contient K est 
une extension galoisienne de K si, et 
seulement si, le groupe de Galois G(L/M) 
est un sous-groupe normal de G(L/K) et, 
dans ce cas, le groupe de Galois G(M/K) 
s’identifie au groupe quotient G(L/K)/ 
G(L/M). 

Il est maintenant possible de donner un 
sens précis à la « résolubilité par radi- 
caux ». Une équation algébrique 
P(X) = 0 à coefficients dans un corps K 
de caractéristique 0 est résoluble par 
radicaux , par définition, si le corps de 
rupture K p de P(X) sur K peut être 
« plongé » comme sous-corps dans un 
corps L tel qu’il existe une suite de 
sous-corps de L, L 0 = K, L b L*_j, 
L* — L, avec L /+1 — L,^,), x { étant 
racine d’une équation x ,n — a, = 0 avec 
a t G L,-. En traduisant cette définition au 
moyen du dictionnaire que fournit la 
correspondance de Galois, on obtient 
assez facilement le critère : la résolubilité 
par radicaux de l’équation P(X) = 0 équi- 
vaut à la résolubilité du groupe de l’équa- 
tion G = G(K p /K). Rappelons qu’un 
groupe G est un groupe résoluble s’il 
possède une suite de composition : 

(l]=G 0 CG I CG 2 C...CG„„ 1 CG n = G ) 

telle que les quotients GJGj_ \ soient des 
groupes commutatifs. 

L’équation générale du n- ième degré : 
X" -f- î„_\ X" ! -f- ... + t\ X = 0, à 
coefficients algébriquement indépendants 
dans le corps Q(/ 0 , t u ..., t a pour 
groupe le groupe symétrique S„ des per- 
mutations de n éléments. Comme on sait 


que ce groupe n’est pas résoluble lorsque 
n ^ 5, il est inutile d’espérer une formule 
de résolution par radicaux des équations 
de degré supérieur ou égal à 5. La théorie 
de Galois a permis de ramener le théorème 
de Ruffini-Abel à un théorème de théorie 
des groupes. 

Signalons pour terminer qu’une exten- 
sion L d’un corps K est dite cyclique (resp. 
abélienne , résoluble) si elle est galoisienne 
et si son groupe de Galois est cyclique 
(resp. commutatif, résoluble). L’étude 
des extensions abéliennes des corps 
de nombres algébriques constitue l’objet 
de la théorie du corps de classes , dont 
l’initiateur fut D. Hilbert (1900) et dont les 
principaux résultats furent démontrés par 
T. Takagi et E. Artin, 1920-1930 (cf. 
théorie des nombres — Nombres algébri- 
ques). 

Exemple de détermination 
d'un groupe de Galois 

Nous avons déjà considéré le corps de 
rupture L de P(X) = X 3 — 2 sur le corps 
Q des nombres rationnels. Comme d’habi- 
tude, L sera vu comme un sous-corps de C. 
Soit a la racine réelle de P(X) = 0. Les 
conjugués de a sont aj et q/' 2 , où 

. —1 +/V3 . 7 — 1 — / V3 

y = j et;>=,= 

sont les racines cubiques non réelles de 
l’unité. Nous avons donc L = Q(a, /). 
Comme [L : Q] = 6 , l’ordre du groupe de 
Galois G(L/Q) est 6 . Il reste donc, pour 
déterminer complètement ce groupe, à 
trouver six automorphismes distincts de L. 
Un automorphisme de L est connu dès que 
l’on connaît son action sur a et /. La 
conjugaison complexe o échange j et J et 
laisse fixe a ; l’automorphisme r échange 
j et J d’une part et a et aj de l’autre. Nous 
pouvons dresser un tableau donnant les 
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images de a et j par différents automor- 
phismes : 



e 

a 

T 

(T r 

t a 

<JT(T 

a 

a 

a 


«7 

«7 

«7 


J 

J 

j 

j 

j 

7 


Dans cet exemple, le groupe de Galois 
est le groupe de toutes les permutations des 
racines, mais, en général, c’est seulement 
un sous-groupe de ce corps, car toute 
permutation des racines ne se prolonge pas 
nécessairement en un automorphisme des 
corps. 

Corps finis 

Une application intéressante de la théorie 
de Galois est l’étude et la classification des 
corps finis. Soit donc F un groupe fini 
possédant q—p n éléments (cf. chap. 1). 
Le groupe multiplicatif des éléments non 
nuis de F est d’ordre q— 1, donc tout 
élément de ce groupe vérifie — 1=0 
et, par suite, tout élément de F vérifie : 

P„(x) = xP n — x = 0. 

Comme il est clair que les racines 
de P„(X) dans une clôture algébrique 
F p de F p forment un corps, le corps à 
q = p n éléments F est un corps de rupture 
sur F /? pour le polynôme P„(X). Ce qui 
démontre l’existence et l’unicité, à un 
isomorphisme près, de corps finis à p n 
éléments. 

Nous pouvons interpréter ce qui pré- 
cède en termes de théorie de Galois. Soit 
F p une clôture algébrique du corps premier 
F ; , = Z//;Z, et soit c p l’automorphisme de 
Frobenius qui associe à tout élément x de 
F ; , sa puissance p - ième x p . Si G„ désigne le 
sous-groupe de G(F p /F p ) engendré par <p", 
le corps des invariants de G„ n’est autre 
qu’un corps de rupture pour P„(X) que 
nous noterons F^ n , et qui a p n éléments. 


L’automorphisme de Frobenius cp, consi- 
déré comme un automorphisme de F n sur 
F p , est d’ordre n et il engendre donc le 
groupe de Galois G(F JF p ). Soit plus 
généralement m et n deux entiers ^ 1 , le 
corps F est extension du corps F n si, et 
seulement si, n divise m ; cette extension 
est alors cyclique de degré m/n et son 
groupe de Galois est engendré par cp". 


3. Corps non commutatifs 

On a examiné jusqu’à présent des corps qui 
étaient commutatifs, mais l’étude des 
corps non commutatifs n’est pas d’un 
moindre intérêt. 

Si K est un corps non commutatif, 
l’ensemble Z des éléments de K qui 
permutent avec tout élément x, c’est-à-dire 
tels que .vz = zv, est visiblement un corps 
commutatif que l’on appelle le centre de K. 
Nous avons déjà signalé l’exemple des 
quaternions Fl dont le centre n’est autre 
que le corps R des nombres réels. Voici un 
autre exemple dû à Hilbert : 

Soit F^ un corps fini h q = p r éléments 
(r ^ 2), si on munit l’ensemble des séries 
formelles Z, a„T n sur F,, de l’addition 
habituelle et d’une multiplication déduite 
par distributivité et associativité de la règle 
élémentaire Ta — a p T, on obtient un corps 
non commutatif F'((T)). Il est facile de voir 
que le centre de ce corps est formé des 
séries formelles constantes a 0 où a 0 G F /? et 
qu’il est donc isomorphe à F^. Les séries 
formelles à coefficients dans F^ forment un 
sous-corps commutatif de F t '((T)). 

On peut développer au sujet des corps 
non commutatifs des considérations tout à 
fait analogues à celles qui ont été faites 
dans le cas des corps commutatifs. En 
particulier, on sait définir la caractéristique 


159 


CORPS 


d’un corps non commutatif, et cette carac- 
téristique n’est autre que celle du centre. 
De même, si L est un corps non commu- 
tatif et K un sous-corps de L, la notion 
d 'adjonction à K d’un sous-ensemble S de 
L garde tout son sens. Il est à remarquer 
que si K est commutatif et x un élément de 
L qui permute avec tout élément de K, le 
sous-corps K(x) de L obtenu par adjonc- 
tion de x à K est encore commutatif, ce qui 
permet de démontrer l’existence de sous- 
corps commutatifs maximaux dans L (c’est- 
à-dire de sous-corps commutatifs qui ne 
sont contenus strictement dans aucun 
autre sous-corps commutatif). L’étude des 
automorphismes des extensions commuta- 
tives finies d’un corps commutatif conduit 
à ce qu’on appelle la théorie de Galois. 
Mais il existe une théorie de Galois 
non commutative due à E. Noether et 
T. Skolem (1928), dont on donne 
ci-dessous quelques résultats. Si K est un 
corps non commutatif de centre Z, il est 
facile de mettre en évidence des automor- 
phismes de K qui laissent Z fixe : pour tout 
élément non nul x de K, l’application 
y^xyx 1 de K dans K est un automor- 
phisme cr v de K. Les automorphismes de la 
forme <x v sont appelés les automorphismes 
intérieurs de K. Un théorème de Skolem- 
Noether assure que, si K est un corps non 
commutatif de degré fini sur son centre Z, 
il n’existe pas d’autres automorphismes de 
K laissant Z fixe que les automorphismes 
intérieurs. Un autre théorème permet de 
préciser la structure des corps non com- 
mutatifs K de degré fini sur son centre Z. 
Si L est un sous-corps de K qui contient Z, 
l’ensemble L' des éléments y de K tels que 
xy = yx pour tout x dans L est un 
sous-corps de K qui contient Z et que l’on 
appelle le commutant de L. On voit faci- 
lement que, si on répète l’opération, on a 
(L')' = L. De plus, on a l’égalité 


[K : Z] = [L : Z] [L' : Z]. Il résulte immé- 
diatement des définitions qu’un sous-corps 
L est commutatif si, et seulement si, L C V 
et que les sous-corps commutatifs maxi- 
maux sont ceux pour lesquels L = L\ Si 
bien que, si n est le degré sur Z d’un 
sous-corps commutatif maximal de K, on 
a [K : Z] = n 2 : le degré d’un corps non 
commutatif sur son centre est toujours un 
carré. C’est bien ce qu’on vérifie dans le 
cas du corps H des quaternions où C est 
un sous-corps commutatif maximal 
[H : R] = 4 = 2 2 = [C : R] 2 . 

Signalons enfin que R. Brauer a pu 
munir l’ensemble Br(Z) des classes d’iso- 
morphisme de corps de centre Z et de 
degré fini sur Z d’une structure de groupe. 
Ce groupe, appelé le groupe de Brauer de 
Z, reflète un grand nombre de propriétés 
arithmétiques du corps Z, ainsi que l’ont 
montré H. Hasse et R. Brauer lui-même. 

ROBERT GERGONDEY et E.U. 
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E n fondant la géométrie analytique, 
Descartes avait substitué au plan de la 
géométrie d’EucIide l’ensemble R 2 des 
couples de nombres réels et, de ce fait, à 
la notion de courbe, celle d’équation. La 
construction d’un point, puis la détermi- 
nation d’un lieu géométrique se trouvaient 
ainsi remplacées par une représentation 
paramétrique, et une élimination. L’exis- 
tence de méthodes canoniques d’élimina- 
tion en théorie des polynômes est sans 
doute à l’origine de l’intérêt porté aux 
courbes algébriques, c’est-à-dire, grosso 
modo, à l’ensemble des points d’un plan où 
s’annule un polynôme. 

Le rôle important de l’homogénéité 
dans la théorie des polynômes, aperçu au 
moment où s’élaborait la géométrie pro- 
jective, a conduit à concevoir les modèles 
de courbes algébriques comme apparte- 
nant au plan projectif, qui a l’avantage 
d’être compact. D’autre part, si la concep- 
tion initiale de la géométrie analytique était 
essentiellement une question de variables 
réelles, les géomètres algébristes ont été 
amenés à prendre comme corps de base le 
corps complexe à cause de la propriété 
fondamentale suivante : Tout polynôme de 
degré n à coefficients complexes a exacte- 
ment n racines complexes, en tenant 
compte de leur ordre de multiplicité (pro- 
priété de clôture algébrique du corps C des 
nombres complexes) ; les courbes algébri- 
ques ont été les premiers exemples de 
variétés analytiques complexes. 

Cela n’empêche pas, au moins dans le 
cas des polynômes à coefficients réels, 
pour aider l’imagination, de s’intéresser à 
la courbe réelle, lieu des points à coordon- 
nées réelles, dans un plan affine ou même 
métrique déduit du plan projectif en spé- 


cialisant une droite à l’infini et en munis- 
sant le repère des propriétés adéquates 
(orthogonalité, normes) : c’est la raison 
pour laquelle les mathématiques ont connu 
toute une abondante « flore » de courbes 
algébriques remarquables. 

* 


1. Courbes irréductibles 

Considérons donc un plan projectif com- 
plexe, dans lequel les coordonnées homo- 
gènes sont v, y, z, et un polynôme (à 
coefficients réels ou complexes) homo- 
gène F de degré n ; 

F(x,y,z) — 0 

est l’équation d’une courbe algébrique. Le 
point A ( a , b , c) appartient à la courbe si : 

F(a , b,c) — 0. 

Si l’on représente le même point par les 
coordonnées Xa , Xb , Xc , où X ^ 0, on a : 

F = X"F (a,b,c) = 0 ; 

on voit que ce fait est bien indépendant du 
choix des coordonnées homogènes et que 
des polynômes proportionnels définissent 
la même courbe. 

Si F(x, y, z) n’est pas décomposable sur 
le corps complexe en un produit de fac- 
teurs non constants, tout polynôme qui 
s’annule partout où s’annule F est de la 
forme : 

F (x,y,z)G(x,y f z); 

par suite, si on appelle courbe irréductible 
l’ensemble des points où s’annule un poly- 
nôme indécomposable, la connaissance de 
la courbe entraîne celle de son équation (à 
un facteur constant non nul près). 
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La décomposition d'un polynôme quel- 
conque en produit de facteurs irréductibles 
montre alors qu’une courbe algébrique 
générale doit être considérée comme cons- 
tituée de composantes irréductibles , affec- 
tées chacune d’un exposant qui est un 
entier naturel, sa multiplicité . C’est ainsi 
que la courbe : 

(x 2 + y 2 —z 2 )z 2 = 0 

est formée de la droite double z — 0 et de 
la conique simple x 2 + y 2 — z 2 = 0. 

Bien entendu, la notion de composante 
irréductible (et la multiplicité correspon- 
dante) sont des notions projectives, indé- 
pendantes du choix du repère, mais qui 
sont essentiellement liées au fait que le 
corps de base est algébriquement clos. 


2. Tangentes 

Intersection avec une droite 

Considérons une droite projective joignant 
les point A(.\ Vj, Cj) et B(.y 2 , v 2 , ~ 2 ) et son 
intersection avec la courbe F(.y, y, z) = 0. 
On obtient : 

F(àa + M B) 

- X"F(A) + X"” 1 juP^A, B) + A"- 2 m 2 P 2 (A, B) 
+ ... + (J" F(B) - 0. 

Si tous les coefficients sont nuis, cette 
équation est une identité : tout point de 
la droite appartient à la courbe qui 
admet la droite comme composante irré- 
ductible. 

Toute droite qui n’est pas composante 
de la courbe la coupe en n points (n étant 
le degré de F) compte tenu de leur ordre 
de multiplicité, et cet énoncé a exactement 
la même signification que l’affirmation : 
une équation algébrique de degré n admet 
n racines. 


Supposons maintenant que A est un 
point de la courbe F(A) = ü, et faisons 
varier B arbitrairement ; si le polynôme : 

P t (A, M) = xf' x i + yf' y i 4- zf\ i 

n’est pas nul quel que soit M, toute droite 
passant par A coupe la courbe en ce point 
avec la multiplicité 1, à l’exception de la 
droite : 

xf x i + yf y i + zf z \ — 0, 

qui coupe la courbe en A avec une 
multiplicité au moins égale à 2. Le point A 
est alors appelé un point simple de la 
courbe, et la sécante exceptionnelle est 
appelée la tangente en A (en accord avec 
les formules différentielles de la géométrie 
analytique). 

Lorsque : 

Pi(A, M) = ... = P*_!(A f M) = 0 

sont nuis quel que soit M, sans qu’il en soit 
ainsi de P*, toute droite passant par A 
coupe la courbe en ce point avec la 
multiplicité k, à l’exception des droites qui 
vérifient P*(A, M) — 0, qui coupent la 
courbe en A avec une multiplicité au moins 
égale à k + 1. Le point A est alors appelé 
un point multiple k-uple de la courbe, et les 
sécantes exceptionnelles sont appelées les 
tangentes en A. 

Le point A est multiple A-uple de la 
courbe si toutes les dérivées d’ordre k 1 
de F sont nulles en ce point (et pas toutes 
les dérivées d’ordre k). Bien entendu, un 
changement de variables projectif sur 
(À, p) ou sur („y, v, z) montre que les 
résultats précédents sont indépendants des 
repères. 

Équation tangentielle 

La question se pose alors de caracté- 
riser une courbe algébrique non plus 
comme l’ensemble de ses points, mais 
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comme l’ensemble de ses tangentes. 
L’équation tangentielle est une condition 
nécessaire et suffisante entre les nombres 
w, v, w pour que la droite d’équation pro- 
jective : 

ux + vy + wz ~ 0 

soit tangente à la courbe. L’élimination de 
v, y\ z entre les relations : 

F (x t y,z) = 0 

et F' x /u = F’ y /v = F' z /w 

conduit à une équation tangentielle algé- 
brique : 

G(«, v, w) = 0. 

Lorsque la courbe est irréductible (et 
n’est pas une droite), l’un des facteurs 
irréductibles de G représente l’enveloppe 
proprement dite, c’est-à-dire l’ensemble 
des tangentes ; les autres facteurs irréduc- 
tibles sont linéaires : chacun exprime le 
passage d’une droite par l’un des points 
singuliers de la courbe. 


3. Quelques exemples 

La courbe dont l’équation affine est : 

X 3 +x 2 — y 2 = 0, 

c’est-à-dire dont l’équation projective, en 
coordonnées homogènes, est : 

x 3 + x 2 z — y 1 z = 0, 

est appelée cubique nodale (fig. 1). 

Elle admet l’origine (x = 0, y = 0, 
z= 1) comme point double (de multipli- 
cité 2) ; les deux tangentes en ce point sont 
les droites y = ± x. Le point ( x = 0, 
y == 1, z — 0) est un point simple, pour 
lequel la tangente z = 0 coupe la courbe 
avec la multiplicité 3 : on l’appelle un point 
d Inflexion. Les cubiques nodales sont tou- 



tes projectivement identiques. On rencon- 
tre le modèle métrique : 

y = xV(a + x)/(a— x), 

qui a quelques propriétés liées à la géo- 
métrie du cercle et qu’on appelle la stro- 
phoïde. On rencontre également le modèle 
métrique : 

je = 3 1 — t 2 

y = 1 — 3 f 2 

appelé cubique de Tschirnhausen , pour 
lequel la longueur de l’arc est fonction 
rationnelle des coordonnées. 

La courbe dont l’équation affine est : 

x 3 — y 2 = 0 

est appelée cubique cuspidaie (fig. 2). Elle 
admet l’origine (x = 0, y = 0, z = 1 ) 
comme point double (de multiplicité 2) ; il 
y a en ce point une tangente unique y = 0. 
Les cubiques cuspidales sont toutes pro- 
jectivement identiques. On rencontre le 
modèle métrique : 

x 3 + (x — 2R)j/ 2 = 0 
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lié à la géométrie du cercle, et qu’on 
appelle la cissoïde . La développée de para- 
bole est aussi une cubique nodale. 

La courbe dont l’équation projective 
est : 

y 2 z 2 + z 2 x 2 + x 2 y 2 — 2xyz(x + y + z) = 0 

est une quartique tricuspidale . Elle admet 
les trois sommets du repère (0, 0, 1 ; 0, 
1, 0; 1, 0, 0) comme points doubles, 
en chacun desquels il y a une tangente 
unique : respectivement les droites x = y, 
z — a\ y = z, concourantes au point 
unitaire. Lorsque le repère est choisi sui- 
vant un triangle équilatéral dont le point 
unitaire est le centre, la courbe métrique 
ainsi définie est connue sous le nom 
d’ hypocydoïde à trois rebroussements 
(fig. 3). 

4. Intersection 
de courbes algébriques 

L’étude de l’intersection de deux courbes 
algébriques F et G de degrés respectifs m 



et «, qui n’ont aucune composante com- 
mune, a été faite par Bezout : il y a un 
nombre fini de points communs, et 
chacun est affecté d’un entier naturel, 
sa multiplicité (d’intersection) ; dénom- 
brés avec cet élément de pondération, il y 
a mn points communs (sur le corps com- 
plexe). Ce théorème, tiré d’une étude 
attentive du résultant, n’a pas été apprécié 
à sa juste valeur par les non-spécialistes : 
faute d’avoir une définition explicite de la 
multiplicité d’intersection, ils voyaient 
dans le théorème de Bezout une espèce 
d’affirmation alchimique. On s’est borné à 
utiliser le théorème de Bezout dans cer- 
tains cas simples : lorsque tous les points 
communs à F et G sont simples sur 
chacune d’elles, avec des tangentes distinc- 
tes, il y a exactement mn points communs. 
C’est ainsi que la courbe formée de m 
droites parallèles à 0>’ et la courbe formée 
de n droites parallèles à O.v se coupent aux 
mn sommets d’un quadrillage. 

Un autre cas assez simple est celui où 
un point commun étant multiple d’ordre r 
pour F et d’ordre s pour G, il n’y a aucune 
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droite commune aux deux faisceaux de 
tangentes en ce point : la multiplicité 
d’ intersection est alors rs (et elle est 
supérieure dans le cas contraire). 

La situation n’est devenue claire que 
lorsque G. Halphen eut montré comment, 
par une étude locale des courbes F et G en 
un point commun, on pouvait définir la 
multiplicité d’intersection. 

Considérons par exemple les deux cubi- 
ques : 

F = x* — y 2 = 0, 

G — jc 3 + y 3 — 2y 2 = 0. 

Elles ont en commun trois points sim- 
ples, avec la multiplicité 1, dont les coor- 
données satisfont à : x* = 1 , y = 1 , et le 
point O qui est pour chacune d’elles un 
point double (r = 5 = 2) avec une seule 
tangente O.v. Ce point a la multiplicité 
d’intersection 6. 

On le vérifie en portant x — / 2 , y = f 3 , 
représentation paramétrique de F, dans 
G : 

G (t 2 , t 3 ) = t 9 — t 6 = (t 3 — 1 )t 6 = 0. 


5. Étude locale 
d'un point singulier 

Un point d’une courbe algébrique étant 
pris comme origine des coordonnées dans 
un modèle affine, l’étude du voisinage de 
O a été poursuivie par deux méthodes. 
Celle de Noether consiste à effectuer des 
transformations birationnelles ayant O 
pour point d’indétermination : elle relève 
des techniques de la géométrie algébrique. 
Celle de Enriques consiste à utiliser les 
développements de Puiseux : elle relève de 
l’analyse classique des fonctions d’une 
variable complexe. 


La courbe (irréductible) F(x, y) = 0, 
qui passe en O, définit y comme fonction 
algébrique de la variable complexe .y, 
multiforme, dont certaines déterminations 
s’annulent pour x = 0. 

On appelle branche algébroïde de la 
courbe F un ensemble de ces détermina- 
tions qui subit une permutation circulaire 
lorsque la variable complexe x décrit, dans 
le plan complexe, un petit cercle autour de 
l’origine. Si k est le nombre de détermi- 
nations constituant une branche, en faisant 
le changement de variable x = t k , chacune 
de ces déterminations devient une fonction 
entière de / :y =f (?), et on passe de l’une 
à la suivante en changeant t en Çf, le 
coefficient Ç étant une racine primitive 
/r-ième de l’unité . 

Les propriétés arithmétiques des expo- 
sants qui figurent dans la série entière / ( t ) 
ont été interprétées topologiquement 
(variété analytique complexe) et dans la 
géométrie infinitésimale de la courbe au 
voisinage de l’origine. 


6. Courbes unicursales 

Lorsqu’on a obtenu pour une courbe une 
représentation paramétrique uniforme, on 
détient un moyen commode pour l’étude 
de ses propriétés globales. C’est la raison 
de l’intérêt porté aux courbes unicursales, 
c’est-à-dire aux courbes qui, en coordon- 
nées affines, admettent une représentation 
paramétrique rationnelle : 

* = P(0/R(0, y = Q(0/R(0, 

où P, Q, R sont des polynômes en t . 

Les courbes unicursales sont souvent 
appelées les courbes rationnelles, car il 
résulte d’un théorème de Lüroth qu’elles 
sont les transformées birationnelles des 
droites projectives. 
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Les coniques (courbes algébriques irré- 
ductibles du second degré) sont rationnel- 
les ; elles admettent en effet la forme 
réduite projective : 

xz — y 1 = 0 , 

qui conduit à la représentation : 

x = t 2 , y — /0, z = 0 2 , 

où t, 0 sont des paramètres complexes. De 
ce fait, on peut définir sur une conique le 
birapport de quatre points, les divisions 
homographiques et involutives. Ces 
notions peuvent être étendues à toute 
courbe rationnelle. 

L’équation de la tangente au point 
courant d’une courbe paramétrique et la 
théorie des enveloppes montrent qu’il y a 
identité entre les courbes qui sont ration- 
nelles du point de vue ponctuel et les 
courbes qui sont rationnelles du point de 
vue tangentiel. 

Les cubiques rationnelles sont les cubi- 
ques à point double, dont nous avons 
donné les deux modèles ; la cubique nodale 
citée ci-dessus admet pour représentation : 

X = 4t/{1— ty, y = 4t(l +0/(1— O 3 , 

et la condition nécessaire et suffisante pour 
que trois points de la courbe soient alignés 
est t { t 2 t 3 = 1. 

La cubique cuspidale citée ci-dessus 
admet la représentation : 

x = t 2 , y — t\ 

et la condition d’alignement de trois points 
est : 

1 /h + l/* 2 + l/* 3 = 0. 

Les courbes rationnelles sont, parmi les 
courbes irréductibles de leur degré, celles 
qui ont les singularités les plus importan- 
tes, soit par leur nombre, soit par la 
complexité de leur structure : si une courbe 


rationnelle de degré n n’a que des points 
doubles de même nature que ceux des 
cubiques, ces points sont au nombre de : 

(n — 1)(« — 2)/2. 

C’est ainsi que la quartique tricuspidale 
citée plus haut est rationnelle ; elle admet 
la représentation : 

x = l/t 2 , y — \/{t — l) 2 . 

Mais la quartique d’équation (affine) : 
{x 2 +y 2 ) 2 -3x 2 y + y 3 = 0, 


que l’on appelle parfois trifolium (fig. 4), 
admet un seul point singulier, l’origine, qui 
est un point triple. En coupant cette courbe 



par les droites issues de O, on obtient sans 
difficulté la représentation paramétrique : 

It—O 3 t 2 — t* 

* - (l+r 2 ) 2 ’ ^'(l+r 2 ) 2 ' 

L’existence de points doubles plus com- 
plexes (points infiniment voisins, contact 
des branches algébroïdes) permet de don- 
ner des exemples d’une nature différente. 
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La quartique (fig. 5) d’équation 
(affine) : 

2x 4 -f y 4 — J>(3-* 2 + 2j> 2 ) -f = 0 

admet deux points doubles ; le point A 
| fig. 5 I 


y 



(x = 0, y = 1 ), qui est un point nodal, et 
l’origine, qui est un point tacnodal (contact 
de deux branches algébroïdes). Cette quar- 
tique admet la représentation paramétri- 
que : 

x = t(t 2 — 1)V3/D, y = t 2 /D, 

OÙ : D = 3 r 4 — 8f 2 + 6. 

La quartique (fig. 6) d’équation 
(affine) : 

(x 2 — y y + yi(y- 1 ) = 0 

admet un point double unique, à l’origine ; 
c’est un point oscnodal (osculation de deux 
branches algébroïdes). Cette singularité 
suffit à assurer la rationalité, et la quartique 
proposée admet la représentation paramé- 
trique : 

* = 4 t{t 2 + 3)/D, y = 16/ 2 /D, 

D = (r + 3) 2 {t — l) 2 + 16t 2 . 



7. Courbes elliptiques 
Définitions 

Nous avons dit que les cubiques sont 
rationnelles lorsqu’elles ont un point dou- 
ble. Les cubiques sans point singulier sont 
projectivement réductibles à la forme : 

y 2 = 4x*—g 2 x—g 3 

(dans laquelle l’équation y = 0 doit avoir 
trois racines simples). Cette forme réduite, 
définie à une homothétie près, dépend du 
seul paramètre : 

l=g\/gy 

La définition de la fonction elliptique 
p(«) de Weierstrass met en évidence la 
représentation paramétrique = p(w), 
y = p'(«) ; c’est la raison pour laquelle les 
cubiques sans singularité sont appelées 
cubiques elliptiques. 

L’argument : 

„= r^= r dx 

J y J V 4x 3 — g 2 x — gj 
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est Y intégrale abélienne (de première 
espèce) attachée à la courbe. Plus généra- 
lement, deux fonctions elliptiques de 
mêmes périodes sont liées par une relation 
algébrique : elles constituent la représen- 
tation paramétrique d’une courbe algébri- 
que dite courbe elliptique . 

Si o) et G)' sont deux périodes de base 
d’une fonction elliptique, on appelle paral- 
lélogramme de période tout parallélo- 
gramme admettant pour sommets les ima- 
ges des nombres complexes : 

k o) + k 'g)\ (k + 1) co + k 'g/, 

k iù (k — 1 ) <jl) , (/r -f- 1 ) Cl) — 1~ (/c 

où k , k ' sont des entiers relatifs. Dans un 
parallélogramme de période, une fonction 
elliptique prend le même nombre de fois 
toute valeur, et la somme des zéros est 
égale à la somme des pôles. Comme la 
fonction p (u) a un pôle double à l’origine, 
la fonction : 

ap(u) + bp'(u) + c, 

fournit la condition nécessaire et suffisante 
d’alignement de trois points d’une cubique 
elliptique : 

«i + u 2 + w 3 ^ 0 raodulo o>, 

u) et co ' étant deux périodes de base (cf. 
fonctions analytiques — Fonctions ellip- 
tiques et modulaire). 

Si, dans l’étude des cubiques nodales, 
nous faisons le changement de représen- 
tation, u — log t la condition d’alignement 
devient : 

w { + «2 + w 3 = 0 modulo 2 i 7r. 

Pour les cubiques cuspidales, u est le 
paramètre \/t lui-même. On voit ainsi 
comment les cubiques rationnelles sont 
obtenues par dégénérescence des cubiques 
elliptiques. 


Loi de groupe 

Le théorème des points alignés (théorème 
de Lamé) consiste en ceci (fig. 7 ) : coupons 
la cubique par trois droites AjA^, 
QC2C3, telles que les points 
A^jQ et A 2 B 2 C 2 , respectivement, soient 
alignés. Alors A3B3C3 sont aussi alignés, 
car la somme totale des affixes est nulle. 



Lorsque, dans la condition d’aligne- 
ment, on fait u x = u 2 = W3, on voit que la 
cubique elliptique a neuf points d’inflexion 
(la cubique nodale trois et la cubique 
cuspidale un seul) : 

u = k g)/3 -F k 'cl>'/3 

(où k , k ' sont des entiers relatifs modulo 3 ). 
Ces points sont tels que toute droite qui en 
joint deux en contient un troisième, et cette 
propriété définit complètement la configu- 
ration. Un modèle métrique est obtenu en 
coupant un triangle équilatéral par la 
droite de l’infini et le cercle de rayon nul 
qui lui est concentrique. 
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Sur la figure 7, qui illustre le théorème 
des points alignés, nous avons placé B 2 en 
un point d’inflexion. Cela va nous permet- 
tre de montrer la structure de groupe 
abélien de la cubique elliptique, qui a B 2 
pour élément neutre : deux points (tels que 
B) et B 3 ) alignés sur B 2 sont opposés ; 
quand trois points sont alignés chacun est 
opposé à la somme des deux autres. Ainsi, 
la somme Aj + A 3 est C 2 opposé de A 2 . 
Cette opération est évidemment commu- 
tative et le théorème de Lamé établit son 
associativité : 

(A 2 + Aj) + Bj = ( — A 3 ) + ( — B 3 ) = C 3 , 

A 2 + (A< + Bj) = (- C 2 ) + (- Ci) = C 3 . 

La détermination du point (X, Y) 
somme des points (xq, yf et (x 2 , y 2 ) se fait 
rationnellement et cette propriété est en 
liaison directe avec le théorème d’addition 
pour la fonction p(u) : 


Y _ *172— x 2 yj x y 2 —yi , 

[ *2— *1 *2— *1 

D’un point arbitraire d’une cubique 
elliptique, on peut lui mener quatre tan- 
gentes, dont les contacts ont des arguments 
qui diffèrent d’une demi-période. D’après 
un théorème de Salmon, lorsque le point 
parcourt la cubique, le faisceau de ces 
quatre tangentes reste projectivement 
constant. 

L’invariant (birapport symétrisé) de ce 
faisceau s’exprime au moyen de I, ou du 
quotient co'/co des périodes : c’est la signi- 
fication géométrique de la fonction modu- 
laire : 

4 (1 — r + r 2 ) 3 g\ 

27 r 7 -{l~ry g\ — Hg\ 

Les méthodes utilisées pour l’étude des 
courbes elliptiques ont été généralisées aux 


courbes qui admettent une intégrale abé- 
lienne hyperelliptique ; pour cette raison 
on les appelle courbes hyperelliptiques. 
L’extension aux courbes algébriques géné- 
rales de la méthode paramétrique nécessite 
l’emploi des fonctions fuchsiennes intro- 
duites par Henri Poincaré. 


8. Le genre 

L’étude locale a permis de définir en 
chaque point d’une courbe algébrique une 
ou plusieurs branches algébroïdes : on 
appelle place la donnée d’un point et d’une 
branche algébroïde issue de ce point. 
L’ensemble des places d’une courbe est la 
riemannienne de cette courbe et on appelle 
cycle (parfois aussi diviseur) de la courbe 
une combinaison linéaire formelle à coef- 
ficients entiers, positifs, négatifs ou nuis, 
des points de la riemannienne, un nombre 
fini seulement de points ayant un coeffi- 
cient non nul. Les cycles d’une courbe 
forment un groupe abélien. 

On appelle ordre d’un cycle la somme 
de ses coefficients. Un cycle est dit effectif 
(ou positif) si tous ses coefficients sont 
positifs ou nuis. Un cycle effectif ayant une 
signification géométrique simple peut, par 
exemple, être obtenu en envisageant, sur 
une courbe C irréductible coupée par une 
courbe algébrique y, chaque branche algé- 
broïde affectée de la multiplicité de Bezout 
correspondante. 

Plus généralement, étant donné une 
fraction rationnelle N(x, y , z)/D(x, v, z), 
où N et D sont deux polynômes homogè- 
nes de même degré, dont aucun n’est nul 
sur toute la courbe C, on peut lui associer 
le cycle Z N — Z D , différence des cycles 
associés au numérateur et au dénomina- 
teur : on vérifie en effet que toutes les 
fractions, formellement différentes, qui ont 
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la même valeur le long de C, conduisent au 
même cycle. Les cycles associés aux frac- 
tions rationnelles sont d’ordre zéro et 
forment un sous-groupe abélien. 

Deux cycles sont équivalents si leur 
différence est un cycle associé à une 
fraction rationnelle. On appelle série 
linéaire complète l’ensemble des cycles 
effectifs équivalents à un cycle effectif 
donné ; cet ensemble a la structure d’un 
espace projectif : si n est l’ordre commun 
à tous ces cycles et r la dimension de 
l’espace projectif qu’ils constituent, on 
désigne la série linéaire par g r n . La classe 
d’équivalence d’un cycle est souvent appe- 
lée série linéaire virtuelle. 

Deux séries linéaires étant données, 
prenons un cycle effectif (respectivement 
Z, Z') dans chacune d’elles : le cycle 
Z + Z' est effectif et définit une série 
linéaire complète, somme des deux séries 
linéaires données. Par exemple, les droites 
qui coupent une cubique elliptique en un 
point fixe découpent sur la courbe une g\. 
Deux g!, étant définies par les droites issues 
des points A et B de la courbe, la somme 
est la g\ découpée sur la courbe par les 
coniques qui passent par A et B ou par tout 
couple de points équivalents. 

Le théorème du reste de Brill-Noether 
énonce que tous les cycles effectifs (s’il en 
existe) obtenus par différence des cycles de 
deux séries linéaires forment une série 
linéaire. Il a trouvé de nombreuses appli- 
cations à l’étude des intersections complè- 
tes. C’est ainsi, par exemple, que si, parmi 
les neuf points communs à deux cubiques, 
il y en a six qui sont situés sur une même 
conique, les trois autres sont alignés. 

Introduit par Riemann, le genre p d’une 
courbe algébrique irréductible est le nom- 
bre des intégrales abéliennes de première 
espèce, attachées à la courbe, linéairement 
indépendantes. Les différentielles holo- 


morphes sur la courbe définissent des 
cycles équivalents qui constituent la classe 
canonique K : les cycles canoniques effec- 
tifs constituent la série canonique qui a 
l’ordre 2 p — 2 et la dimension p — 1 . Sur 
une courbe rationnelle, K a l’ordre — 2. 
Sur une courbe elliptique, K a l’ordre 
zéro ; seul le cycle nul appartient à la série 
canonique qui a la dimension zéro. Cela 
tient à ce que, selon un théorème de 
Liouville, les seules fonctions elliptiques 
holomorphes sont les constantes. 

Soit G un cycle d’une série linéaire g‘ n : 
si la classe K — G contient des cycles 
effectifs, on dit que la série est spéciale, et 
le nombre de cycles effectifs de K — G 
linéairement indépendants est appelé son 
indice de spécialité i. Lorsqu’il n’y en a pas 
(ce qui est, par exemple, le cas pour 
n > 2p — 2), la série g r n est dite régulière. 

La signification géométrique du genre 
est alors donnée par les deux théorèmes 
suivants : Si une série linéaire complète g r „ 
est régulière, on a r = n—p (Riemann). 
Plus généralement, si une série linéaire 
complète g r n a l’indice de spécialité /, on a 
r = n — p + / (Riemann-Roch). 

L’ensemble des séries linéaires complè- 
tes g i p d’ordre p peut, par application du 
théorème du reste, être muni d’une struc- 
ture de variété abélienne de dimension p : 
c’est la jacobienne de la courbe. 

La classe canonique et, par conséquent, 
le genre p ont été introduits d’une façon 
purement algébrique par Enriques, au 
moyen d’une construction tirée du jaco- 
bien. Liée à la théorie des enveloppes, cette 
construction élégante perd malheureuse- 
ment sa valeur en géométrie algébrique 
abstraite sur les corps de caractéristique 
non nulle. 

Une autre définition du genre a été 
présentée par Weierstrass, qui s’intéresse 
aux cycles associés aux pôles d’une fraction 
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rationnelle définie sur une courbe irréduc- 
tible. Une place P munie de la multiplicité 
n peut être l’unique pôle d’une fraction 
rationnelle, à condition que n ne fasse pas 
partie d’un certain ensemble de p entiers, 
les « lacunes », inférieures à 2p — 1. Si P 
pris sur la riemannienne est pris hors d’un 
certain ensemble fini, les lacunes sont 
1,2, En géométrie algébrique abs- 
traite, sur un corps de caractéristique non 
nulle, la seconde partie du théorème de 
Weierstrass n’est pas vraie : il peut arriver 
que pour toute place P les lacunes diffèrent 
de 1,2, ...,/?. 

LUC GAUTHIER 
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DÉRIVÉES PARTIELLES 

ÉQUATIONS AUX 


L es équations aux dérivées partielles 
sont sans doute le domaine des mathé- 
matiques où le lien avec la physique est le 
plus étroit. Il ne s’agit pas seulement du fait 
que les recherches les plus actives, et en 
général les plus importantes, ont été moti- 
vées par des questions de physique. Il s’agit 
aussi, et surtout, du fait que les idées 
apportées par la physique, et notamment la 
mécanique, transposées ensuite dans un 
cadre plus général, ont fourni les outils les 
plus puissants de leur étude. On en trou- 
vera plusieurs exemples dans les articles 
qui suivent. 

Cette étude a eu, à son tour, une 
influence fondamentale sur le développe- 
ment général de l’analyse mathématique 
au xvm e siècle. Le cas le plus célèbre est 
la question de savoir si toute fonction est 
développable en série trigonométrique, 
posée d’abord par les travaux de d’Aîem- 
bert et Daniel Bernoulli sur l’équation des 
cordes vibrantes, puis par ceux de Fourier 
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sur l’équation de la chaleur (cf. séries 
trigonométriques). On peut citer aussi la 
théorie du potentiel (cf. potentiel et 
fonctions harmoniques), née de l’étude 
de la gravitation et du potentiel électrique, 
et devenue un domaine à part entière de 
l’analyse mathématique. Les méthodes par 
dualité, que George Green appliquait déjà 
aux équations aux dérivées partielles dans 
la décennie des années 1830, ont joué un 
rôle essentiel ; elles ont été reprises par 
Henri Poincaré, puis par Jacques Hada- 
mard. Ce point de vue des solutions faibles 
des équations aux dérivées partielles à 
été systématiquement utilisé par l’école 
russe (Izraïl Gelfand, Sergueï Sobolev) 
et a amené Laurent Schwartz à l’élabora- 
tion de la théorie des distributions 
(cf. théorie des distributions) qui consti- 
tue de nos jours le cadre naturel de la 
théorie des équations aux dérivées partiel- 
les linéaires. 

La théorie des distributions s’impose 
aussi pour les problèmes non linéaires, 
car les données non linéaires génèrent, 
même à partir de données régulières, 
des solutions singulières (interprétables 
dans le langage des distributions). Ces 
idées apparaissent déjà chez Riemann 
(1860). 

L’interaction entre le développement 
de la physique et de l’analyse fonctionnelle 
s’est effectuée par l’intermédiaire des 
équations aux dérivées partielles : l’espace 
de Hilbert L 2 est l’espace naturel des 
solutions de l’équation de Schrôdinger de 
la mécanique quantique ; de même, 
l’espace de Sobolev H 1 (cf. chap. 2 Le type 
elliptique , dans la partie A ci-dessous — 
Sources et applications, et 6 Opérations sur 
les représentations et les approximations , in 
représentation et approximation des fonc- 
tions) est l’espace naturel des solutions 


des problèmes de mécanique des milieux 
continus décrits par des équations ellipti- 
ques. 

La transformation de Fourier est par- 
ticulièrement bien adaptée à l’étude des 
équations à coefficients constants et elle a 
permis de disposer, dès le début du siècle, 
d’exemples explicites qui ont servi de 
modèles. L’étude fine de cette transfor- 
mation apparaît lorsque l’on veut établir 
des relations entre la propagation ondu- 
latoire et la propagation corpusculaire 
(par l’intermédiaire des équations des 
ondes ou de Schrôdinger). Une difficulté 
fondamentale est la suivante : il n’existe 
pas de fonction non nulle à support 
compact dont la transformée de Fourier 
soit aussi à support compact. Cette obser- 
vation simple est une version mathémati- 
que naïve de l’inégalité de Heisenberg. 
C’est pour essayer de contourner cette 
difficulté que Hormander et ses collabo- 
rateurs ont introduit les concepts de 
microlocalisation. 

CLAUDE BARDOS et MARTIN ZERNER 

& 


A. Sources et applications 

On se propose de décrire très sommaire- 
ment quelques types classiques d’équa- 
tions aux dérivées partielles issues princi- 
palement de la physique et de préciser 
leurs interventions dans des domaines 
variés des mathématiques. 

Alors que les solutions des équations 
différentielles ordinaires dépendent d’une 
ou de plusieurs constantes arbitraires, 
celles des équations et systèmes d’équa- 
tions aux dérivées partielles dépendent de 
fonctions arbitraires ; il y a donc des 
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familles beaucoup plus riches de solutions. 
Ce fait se voit sur l’exemple particulière- 
ment simple d’une équation linéaire du 
premier ordre : 


n 

x 

j= i 


du 

a ’Wj + cu 


-f, j =1, 


on lui associe le système différentiel des 
caractéristiques : 

x'j(s) - aj(x(sy), j = 1, ..., n, 


dont les trajectoires sont les courbes carac- 
téristiques de l’équation. L’équation aux 
dérivées partielles équivaut alors à une 
équation différentielle ordinaire sur cha- 
que courbe caractéristique. Posant : 

w(s) = u(x(s)), 

cette équation différentielle s’écrit : 

w'(s) +c(x(s))w(s) =f(x(s))] 

il faut la compléter par une donnée initiale 
sur chaque caractéristique, ce qui introduit 
une fonction arbitraire. On remarquera sur 
cet exemple qu’une solution d’une équa- 
tion sans second membre (f = 0) ne peut 
s’annuler en un point sans s’annuler sur 
toute la courbe caractéristique qui passe 
par ce point. 

La façon la plus courante de détermi- 
ner une solution, en particulier dans les 
problèmes d’origine physique, est de fixer 
les valeurs de la fonction et d’une ou 
plusieurs de ses dérivées sur des hyper- 
surfaces. On dit que le problème est bien 
posé lorsque cela détermine une solution et 
une seule. Pour traduire une situation 
physique, un problème doit non seulement 
être bien posé au sens précédent, mais 
posséder en plus une propriété de stabi- 
lité : la solution doit dépendre continû- 
ment des données (en un sens à préciser 


dans chaque problème particulier). Cette 
condition est automatiquement vérifiée 
dans les problèmes linéaires (c’est une 
conséquence du théorème du graphe 
fermé ; cf. espaces vectoriels topologi- 
ques). 

Il est remarquable, ce qui sera évident 
ci-dessous, que les premiers travaux 
systématiques ont porté sur des équa- 
tions du second ordre, qui se sont pré- 
sentées en mécanique, puis dans la théorie 
de la chaleur. L’étude des équations du 
premier ordre, la plus simple du point de 
vue mathématique, n’est venue que plus 
tard. 


1 . L'équation des ondes 
et ie type hyperbolique 


L’équation des ondes (équation de 
d’Alembert) : 


( 1 ) 


d 2 u Jd 2 u d 2 u d 2 u\ 
dt 2 C Uxf + dx\ + dxj) ~ 


régit le comportement de la densité dans 
une onde sonore, c’est-à-dire une pertur- 
bation de faible amplitude d’un gaz non 
visqueux au repos. Dans une série de 
phénomènes physiques représentés par des 
grandeurs vectorielles, chaque compo- 
sante des vecteurs concernés obéit à cette 
même équation : ondes transversale et 
longitudinale dans un solide élastique, 
ondes électromagnétiques, etc. Il faut y 
ajouter les phénomènes analogues dépen- 
dant seulement d’une ou deux variables 
d’espace ; parmi eux, les vibrations trans- 
versales d’un fil élastique donnent lieu au 
cas particulier de l’équation des cordes 
vibrantes : 


( 2 ) 


d 2 u 
< dt 2 


. d 2 u _ 
c 2 ^ = 0, 
dx 2 
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la plus ancienne à avoir été explicite- 
ment étudiée (dans la décennie de 1 740 par 
d’Alembert, Daniel Bernoulli et Euler). 

La possibilité d’écrire toutes les solu- 
tions de l’équation des cordes vibrantes 
sous la forme : 

u(t,x ) — f (x et ) + g{x + et) 

permet d’en voir facilement certaines pro- 
priétés : 

a) Le problème de Cauchy est bien 
posé, tant dans le futur (r > f 0 ) que dans 
le passé (/ < h). Ce problème s’énonce ici : 
«Trouver u vérifiant l’équation (2) et de 
plus les conditions : 

u(t 0 ,x) = u 0 (x) et j~(t Q ,x) = u x (x), 

où u 0 et u ï sont des fonctions don- 
nées. » 

b) Les solutions se propagent à la 
vitesse c. Cette affirmation délibérément 
vague peut se préciser de plusieurs 
façons. Par exemple en revenant au 



Propagation des solutions et domaine de dépen- 
dance pour l'équation des cordes vibrantes : les 
pentes des droites obliques sont ± 1 le. 


problème de Cauchy, avec t 0 nul pour 
simplifier, si w 0 et u x s’annulent en 
dehors d’un intervalle [a, b ], w(r, x) 
s’annule lorsque x est en dehors de l’inter- 
valle [a — c\ t | , b + c\ t |] (fig. 1). Sur 
cette figure, si les données de Cauchy 
u( 0, .y) et ôu/dt (0, A') s’annulent en dehors 
de [a, b ], la solution u s’annule sur toute la 
région ombrée. 

Cette propriété peut s’exprimer de 
façon équivalente en termes de domaines 
de dépendance : u(t , x) ne dépend que des 
restrictions de u 0 et u { à l’intervalle 
[.y — c 1 1 | , x -f- t\ t | ] (fig. 1 ). Le domaine 
de dépendance du point P est le segment 
renforcé sur l’axe des x ; on peut calculer 
w(P) à l’aide des données de Cauchy sur ce 
segment. 

c) Les singularités de la solution se 
propagent, elles aussi , à la vitesse c. Si par 
exemple u { présente une discontinuité au 
point x 0 , on retrouvera des discontinuités 
des dérivées premières de u aux points 
(/, x — et ) et (t, x + et ). 

La possibilité d’expliciter toutes les 
solutions sous une forme simple est tout 
à fait spéciale à l’équation des cordes 
vibrantes. Mais les propriétés que nous 
en avons tirées se démontrent par 
d’autres méthodes pour toute une classe 
d’équations et de systèmes qu’on appelle 
hyperboliques. C’est dans cette classe 
qu’on trouve les équations de base aux- 
quelles obéissent les phénomènes physi- 
ques réversibles, à commencer par l’équa- 
tion des ondes. La formulation du 
problème de Cauchy n’a pas besoin d’être 
changée, du moins tant qu’on se limite à 
une équation du second ordre. La géomé- 
trie de la propagation devient plus com- 
pliquée et, pour la décrire dans le cas 
général, même linéaire, il faut recourir aux 
courbes bicaractéristiques. Nous allons 
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décrire ici deux résultats simples sur 
l’équation : 

(3) ‘j^ — divjc 1 (x)gmd x u) + b~ = 0, 

équation qui décrit la propagation d’une 
onde amortie avec une vitesse dépendant 
du point où on se trouve (comme le son 
dans une atmosphère inhomogène). Nous 
poserons : 


où h est une fonction qui se calcule à partir 
des coefficients de (3) et de S. On voit donc 
que la discontinuité [u] vérifie une équation 
linéaire du premier ordre dont le système 
caractéristique est : 


(5) 


as 1 ôa as 


X’(s) ■■ 


■ — c 2 (x ) grades 
1 


2 grad^(j(r,*-> grad^S); 


o(t,x,T,Ç) = T 2 -cHx)M 2 

(c’est ce qu’on appelle le symbole princi- 
pal). 

Soit u une solution de (3) qui s’annule 
d’un côté d’une hypersurface Z d’équa- 
tion : S (r, x) = 0. On peut démontrer 
que si u ne s’annule pas sur tout un 
voisinage de E, S vérifie l’équation aux 
dérivées partielles non linéaire du premier 
ordre : 

(4) a(l,x,^t grad* S) = 0 ; 

on dit que c’est une hypersurface caracté- 
ristique. 

Supposons de plus que u soit deux fois 
continûment dérivable en dehors de Z 
mais discontinue sur E. Nous noterons [u] 
sa discontinuité ; [w] est donc définie sur E 
comme limite de u(x) quand x tend vers 
un point de E en restant du côté où u ne 
s’annule pas identiquement. Si on cherche 
alors à écrire l’équation (3) au sens des 
distributions, on voit apparaître une dou- 
ble couche portée par E de densité [u] que 
multiplie le premier membre de (4), ce qui 
donne la démonstration dans ce cas par- 
ticulier. Il apparaît également une simple 
couche dont la densité est à un coefficient 
non nul près : 


les trajectoires de ce système qui ont un 
point sur E sont tout entières sur cette 
hypersurface du fait qu’elle est caractéris- 
tique, ce sont des courbes bicaractéristiques 
de l’équation (3). 

Le point important est que u vérifie une 
équation différentielle le long de chacune 
de ces bicaractéristiques, d’où il résulte que 
sa valeur en un point la détermine sur toute 
la bicaractéristique issue de ce point. C’est 
en ce sens que la discontinuité se propage 
le long des bicaractéristiques. De même, si 
à l’instant t = 0 la discontinuité présente 
un pic au voisinage de jt 0 , ce pic se 
retrouvera en chaque point de la bicarac- 
téristique issue de (0, x 0 ). On notera la 
nature cinématique des bicaractéristi- 
ques : elles représentent des points qui se 
déplacent à la vitesse c perpendiculaire- 
ment aux surfaces S = C te ; on retrouve 
ainsi le comportement des rayons lumi- 
neux. 

Pour achever de se ramener à la défi- 
nition générale des bicaractéristiques, on 
vérifiera que, si on pose : 

r(s) = Ô fw), X(s)), 

«*) = grad, S(T(s), X(s)), 

on a sur les bicaractéristiques : 


~ c2 ^ grad * s • + h 


T'(s) = = °' £'(0 = — \ grad x o. 
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Il est remarquable que les conclusions 
de l’étude que nous venons de présenter 
aient été dégagées par Huygens dans son 
Traité de la lumière (écrit en 1 678 et publié 
en 1690) sur la base de considérations 
physiques et géométriques avant que qui 
que ce soit n’ait écrit une équation aux 
dérivées partielles (cf. fig. 2). 


Une série de problèmes importants 
dans les applications concernent la diffu- 
sion (« scattering ») : c’est l’étude du 
rapport entre les comportements asymp- 
totiques des solutions pour t tendant vers 
moins et plus l’infini. 

On appelle systèmes d’évolution du 
premier ordre symétriques, ceux qui ont la 


DE LA LUMIERE. Chap. I. i 7 
du corps tümincux une infinité d’ondes , quoique iffués de 
points différais de cc corps , s’uniffent en forte que fcnftbic- 
meot elles ne compofent qu'une onde feule, qui par confequent 
doit avoir «ffez de force pour fe faire fentir. Ainfi ce nombre 
infini d’ondes qui naiffenc en meûne infbnt de tous les points 
d’une étoile fixe , grande peut cftrc comme le SoIeil,ne font fen- 
fibfetnent qu’une unie onde , laquelle peut bien avoir affez de 
force pour faire un prcflîon for nos yeux. Outre que de chaque 
point lumineux Ü peur venir plufietirs milliers d’ondes dans le 
moindre temps imaginable, par la frequente perçu filon des 
corpufcuîes , qui frappent l’Éther en ces points > ce qui contri- 
bue encore à rendre lo»r a&ion plusfenfible. 

11 y a encore à coofidcter dans l’émanation de ces ondes , que 
chaque particule de U matière, datas laquelle une onde s'étend, 
ne doit pas communiqua fon mouvement feulement à la parti, 
eule prochaine, qui en dans la ligne droite tireé du point lumi- 
neux } mais quelle en donne aufïi mpceffalrement à toutes les au- 
très qui la touchent , & qui s’oppofent à fon mouvement. 

De forte qu’ü faut qu’au- 
tour de chaque particule 
il fe faffe une onde dont 
cette particule foit le cen- 
tre. Ainfi fi d c r eft une 
onde emaneé da point lu- 
mineux a , qui eft fon cen- 
tre ; la particule b, une de 
celles qui font compwfes 
dans la fphere dcf, aura 
fait fon onde particulière 
xci, qui touchera l’onde 
m dcf en c , au mdme mo- 

ment fonde principale, «nanée du point a , eft parve- 
C nue 



44 . /• T R A il T E' 

vent s’étendre plus amplement vers ai haut , & moins vers 

en bas , mais vers les autres endroits plus ou moins félon qu’ds 



approchent de ces deux extrêmes. Ce qui citant, il s’enfuit 
neceffairemenc que toute ligne , qui coupe une de ces ondes à 
angles droits , paffe au deflus du point A , fi ce n’eft la foule qui 
eft perpendiculaire à l’horizon. 

Soit ec l’onde qui porte U lumière au fpeftarair qui eft 
en b , St que b d fou la droite qui coupe cette onde perpen- 
diculairement. Or parce que fe rayon ou la ligne droite, par 
• laquelle nous jugeons l’endroit où 1’objet nous parok , n’eft 
autre chofe que la perpendiculaire à l’onde qui arrive à no- 
-ftre oeït , comme l’on peut entendre par ce qui à efte dit 
cy deffus , il eft ifianifefte que le point a s’appcrcevra com- 
me eftant dans la droite bd, 8c ainfi plus haut qu’il n’eft 

^De mefese fi la Terre eft AS, 6c rexttemité dcrAtmofphere 

-”■/ ■ ’i CD} 


Une méthode importante est l’approxi- 
mation des hautes fréquences qui repose 
sur la construction de solutions appro- 
chées de la forme exp (/v cp) u, où v possède 
un développement limité en v au voisinage 
de l’infini. On trouve que <p vérifie encore 
l’équation des caractéristiques (4) et que 
chaque terme du développement limité de 
v vérifie une équation linéaire du premier 
ordre dont les courbes caractéristiques 
sont des bicaractéristiques de l’équation 
étudiée. On arrive à donner une base 
mathématique rigoureuse aux calculs qui 
se faisaient en optique, dans l’étude des 
radars, etc. 


forme : 


du 

dt 


.du 

, A 'aV + B “’ 


y - 1 


où u est la fonction inconnue (vectorielle) 
et les A j des matrices autoadjointes. Ce 
sont des systèmes hyperboliques et, en fait, 
la plupart des systèmes les plus importants 
peuvent se mettre sous cette forme. 

L’équation de Dirac, qui décrit l’évo- 
lution d’une particule relativiste de spin ‘A, 
est un tel système, où la fonction d’onde de 
la particule a quatre composantes. L’équa- 
tion des ondes peut elle aussi se mettre sous 
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la forme d'un système symétrique. Pour 
cela, on prend pour fonctions inconnues : 

du 


L’équation des ondes devient alors : 

du o _ ^ duj 
d t / j dxj ’ 

y = i 

et on complète le système en écrivant les 
équations qui expriment que les dériva- 
tions par rapport aux .y,- et à t commutent : 


Le sytème obtenu est bien symétrique. 

D’autres équations que les hyperboli- 
ques ont des solutions qui se propagent, on 
en verra des exemples - tous non linéaires 
- dans la partie C ci-après - Équations non 
linéaires. Mais, dans ces autres équations, 
la vitesse de propagation dépend toujours 
de la solution considérée. 


2. Le type elliptique 

L'équation de Laplace, 
ou de Poisson 

Si dans l’équation des ondes on s’intéresse 
à des solutions stationnaires (c’est-à-dire 
indépendantes du temps), on tombe sur 
l’équation de Poisson : 



plus connue sous le nom d’équation de 
Laplace lorsque le second membre est nul, 
et prototype des équations elliptiques. De 
même, si on s’intéresse aux solutions qui ne 


dépendent du temps que par un facteur e k,)î 
ou cos (L>(r — ? 0 ), on voit qu’elles vérifient 
l’équation de Helmholtz : 

Au + k 2 u = 0 . 

Cette équation a des propriétés tout à 
fait analogues à celle de Laplace. 

On retrouve l’équation de Laplace (à 
deux variables indépendantes) comme 
conséquence des conditions de Cauchy- 
Riemann. Elle est donc vérifiée par la 
partie réelle et la partie imaginaire pure de 
toute fonction analytique d’une variable 
complexe. Ce fait a été la source de 
certains problèmes de la théorie des 
équations aux dérivées partielles (quelles 
sont les propriétés des fonctions analy- 
tiques qui peuvent être généralisées ici ?). 
Il a aussi été la source de certaines 
applications dont la plus célèbre est la 
méthode de Joukovski (à une certaine 
approximation, le calcul d’un écoulement 
incompressible autour d’une aile se 
ramène à un problème de représentation 
conforme). 

Les problèmes bien posés pour l’équa- 
tion de Laplace concernent en général les 
solutions sur un ouvert borné Q de R" dont 
nous noterons T la frontière. Les deux plus 
usuels sont : 

- Le problème de Dirichlet : « Trouver u 
vérifiant (6) sur Q et dont la restriction à 
T est donnée. » 

- Le problème de Neumann : « Trouver u 
vérifiant (6) sur Q et dont la dérivée 
normale sur T est donnée. » 

A vrai dire, ce dernier n’est pas tout à 
fait bien posé. D’abord il n’y a pas unicité 
puisqu’en ajoutant à une solution une 
constante, on retrouve une autre solution. 
D’autre part, pour qu’il y ait existence, les 
données doivent vérifier une condition que 
nous allons trouver en utilisant l’outil 
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fondamental pour ce genre de questions, la 
formule de Green : 

J* v A u dx 

— — J grad v . grad u dx + J v ô n u do, 

où d„ désigne la dérivée normale sortante 
et do la mesure superficielle ; nous notons 
g la dérivée normale sortante (donnée) de 
u et nous appliquons la formule de Green 
avec v — 1, ce qui nous donne compte 
tenu de (6) : 

(7) l fdxë i gd °- 

Cette condition a une interprétation très 
claire dans tous les cas où — grad u est le flux 
d’une grandeur (par exemple si — u est le 
potentiel des vitesses d’un liquide animé 
d’un mouvement irrotationnel ; ou si on est 
dans le cas stationnaire de l’équation de la 
chaleur, u est alors la densité d’énergie 
interne et — grad w, moyennant un choix 
d’unités, son flux). Dans cette situation, le 
premier membre de (7) est la quantité de la 
grandeur en question créée à l’intérieur de 
Ü et le second membre la quantité qui sort à 
travers la frontière. 

On rencontre très souvent des problè- 
mes mêlés, c’est-à-dire où on donne u sur 
une partie de la frontière et sa dérivée 
normale sur le reste. Ces problèmes sont 
bien posés. Une série de problèmes géné- 
ralisent celui de Neumann (condition de 
Newton, dérivées obliques...). 

Les solutions des équations de Poisson 
et de Laplace et des équations analogues 
possèdent de multiples propriétés : elles 
sont analytiques, ne peuvent pas avoir de 
maximum ni de minimum à l'intérieur 
d’un domaine où l’équation est vérifiée. 
On appelle fonctions harmoniques les fonc- 
tions qui vérifient l’équation de Laplace 


(cf. POTENTIEL ET FONCTIONS HARMONI- 
QUES). 

Applications à la topologie 

Considérons une variété compacte V et 
munissons-la d’une métrique rieman- 
nienne, comme il est possible de le faire. 
On sait que cette métrique riemannienne 
induit pour tout k un produit scalaire sur 
l’espace vectoriel A k des champs de for- 
mes extérieures de degré k sur V. La 
différentiation extérieure d qui opère de 
A k dans A ) possède donc un adjoint d *. 
Posons : 

A m dd* +d*d. 

Dans le cas des fonctions sur un espace 
euclidien, on retrouve bien le laplacien 
usuel ; c’est essentiellement la formule : 

Au — divgrad w. 

Notons en général À Â . la restriction de 
A à A k . On a alors le théorème de Hodge-de 
Rham : la dimension du noyau de A k est le 
A:-ième nombre de Betti de V. 

Ce théorème a reçu une série de géné- 
ralisations dont le célèbre théorème de 
l’indice d’Atiyah-Singer et, tout récem- 
ment, le résultat d’Alain Connes classifiant 
les feuilletages en attachant un indice aux 
opérateurs elliptiques sur chaque feuillet. 

Principe des travaux virtuels et formulations 
variationnelles 

Les équations vérifiées par le déplacement 
d’un solide élastique en équilibre forment 
un système elliptique. Nous allons en 
donner une formulation fondée sur le 
principe des travaux virtuels. 

Soit Q le volume occupé par le solide au 
repos, T sa frontière. Supposons que sur 
une partie r o de V le solide soit fixé et que 
sur le reste T j on lui applique une force de 
densité superficielle g. Un déplacement 
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admissible est un champ de vecteurs qui 
s’annule sur r 0 . Soit w(x) le déplacement 
du point du solide qui se trouve en x au 
repos. On sait que chaque composante de 
la densité des forces élastiques s’écrit : 

Z 3 à<*j,k 
dx k 

k = 1 

a est le tenseur des contraintes, qui est 
symétrique. Leur travail dans un déplace- 
ment virtuel admissible v est : 


< 8 > 


Ô O ; le , 


— J r 'y'vjOj.ktkdS. 

j,k 


où r indice i évoque le mot « interne » ; les 
n k sont les composantes de la normale 
sortante et c/S la mesure superficielle sur T. 
Soit directement par des considérations 
physiques qu’il serait trop long de décrire 
ici, soit en appliquant à (8) une intégration 
par parties et en tenant compte de la 
symétrie de o, on arrive à la nouvelle 
formule : 


(9) = 


5LZ(ê + 

M 


fok \ 

dxj ) 


°j, k dx . 


La loi de comportement donne l’expres- 
sion de o qui dépend des dérivées de u et (si 
le solide étudié est inhomogène) de x. Usuel- 
lement, si la déformation est assez petite 
pour que le solide reste élastique, il suffit de 
supposer la dépendance en u linéaire. Mais 
il est important de comprendre que nous 
n’avons pas besoin de cette simplification 
ici ; nous ne la faisons donc pas. 

Avant d’écrire que le travail virtuel des 
forces élastiques est égal à celui de la force 
appliquée, il reste à préciser ce qu’est un 
déplacement admissible. Il faut qu’il satis- 
fasse aux liaisons imposées au système, 


c’est-à-dire ici qu’il s’annule sur r 0 . Il faut 
de plus qu’il vérifie une condition de 
régularité qui assure au minimum l’exis- 
tence de l’intégrale qui figure dans la 
formule (9), nous y reviendrons. On abou- 
tit à la formulation variationnelle du pro- 
blème de la recherche du déplacement à 
l’équilibre : Trouver un déplacement 
admissible u qui vérifie pour tout dépla- 
cement admissible t> : 

(10) 

j.k 

= v.gdS. 

En généralisant un peu, on arrive à la 
formulation suivante, où V est un espace 
de fonctions sur Q (qui peuvent être à 
valeurs vectorielles) et les F, des fonctions 
connues (il est commode et peu restrictif 
de supposer qu’elles vérifient F, (x, 0, 0) = 
0) : « Trouver u appartenant à V telle que 
pour toute fonction v appartenant à V : 

(11) JJZfe F ' ( "’"’ gradu) 

/■ = 1 

+ v . F 0 (x , u , grad u ) J dx = J v . g d S. 


Des intégrations par parties montrent 
que u vérifie l’équation aux dérivées par- 
tielles du second ordre : 

n 

(12) F i(* - » (■*)> grad u (AT)) 

1 = 1 

= F 0 (x,u, grad u ) 

et des conditions aux limites qui dépendent 
du choix de l’espace V. 

Le plus grand avantage des formula- 
tions variationnelles est justement de 
contenir à la fois l’équation aux dérivées 
partielles et les conditions aux limites. 
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Voyons cela de plus près pour les problè- 
mes mêlés. Sous forme classique, nous 
cherchons u deux fois différentiable qui 
vérifie (6) sur Q, u — g 0 sur T 0 et ô„u = g { 
sur où g Q et g, sont des fonctions 
données. C’est la formule de Green qui va 
nous permettre de passer à la forme 
variationnelle. Elle assure que pour toute 
fonction v suffisamment régulière et nulle 
sur T 0 : 

(13) — j\grad v • grad u + dx ~ J l # i d s - 

Il reste à définir l’espace V. 
Débarrassons-nous d’abord d’un détail : 
une fonction appartenant à V devra 
s’annuler sur F 0 alors que la solution u y 
vaut g 0 ; il faudra en tenir compte dans la 
formulation du problème. En dehors de 
cela, il nous reste seulement à préciser 
quelle condition de régularité doit vérifier 
une fonction nulle sur r 0 pour appartenir 
à V. La condition (13) suggère de deman- 
der que son gradient ainsi qu’elle-même 
soient de carré intégrable. Or, c’est exac- 
tement la condition que dicte la physique. 
Dans les applications les plus usuelles, 
l’expression : 

J ||grad u \\ 2 dx, 

appelée intégrale de Dirichlet , est à un 
coefficient près l’énergie du système étu- 
dié. C’est le cas en élasticité, en électro- 
statique, dans l’écoulement irrotationnel 
d’un liquide. L’ensemble des fonctions qui 
sont de carré intégrable, ainsi que leur 
gradient, a reçu le nom d 'espace de Sobolev 
et on lui a attribué la notation H 1 (O) (il y 
a des espaces de Sobolev plus généraux). V 
sera donc l’ensemble des fonctions qui 
appartiennent à H ‘(O) et s’annulent sur T 0 
(un théorème assure que cette dernière 
condition a bien un sens pour les fonctions 


appartenant à l’espace de Sobolev). On 
arrive finalement à la formulation sui- 
vante : « Trouver u E H^Q) telle que sa 
restriction à T 0 soit g 0 et que, pour tout 
v E V, la relation (13) soit vérifiée. » 

On notera que les conditions de Diri- 
chlet et de Neumann ont des statuts très 
différents dans la formulation variation- 
nelle : la première doit être imposée à u et 
aussi, par l’intermédiaire de la définition de 
V, à u, alors que la seconde est intégrée dans 
la relation (10), (1 1) ou (13) selon le cas. 

La monotonie 

Le fait d’admettre une formulation varia- 
tionnelle du type (11) n’implique pas 
qu’une équation ou un système soit ellipti- 
que. Au demeurant, les méthodes d’étude 
liées à la formulation variationnelle admet- 
tent une extension au cas hyperbolique, 
c’est ce qu’on appelle la méthode des iné- 
galités d'énergie . Ce qui caractérise l’ellip- 
ticité, c’est une propriété des fonctions F, 
que nous allons aborder maintenant. 

Les propriétés des solutions d’une équa- 
tion aux dérivées partielles sont surtout 
déterminées par les termes contenant les 
dérivées de l’ordre le plus élevé (ici 2). 
Nous allons donc concentrer notre atten- 
tion sur la dépendance en grad u des 
fonctions F, de la formule (11). Nous 
supposerons que F 0 — 0, comme c’est 
d’ailleurs le cas dans l’équation de Poisson- 
Laplace et dans les équations de l’élasticité, 
entre autres. Enfin, nous examinons le cas 
d’une équation, le passage à un système 
n’implique pas ici d’idée nouvelle, seule- 
ment une complication du formalisme. 
Nous posons F = (F h F„). 

On dit qu’une fonction F est monotone 
si pour tout couple (w, u) E R n X R n : 

(14) (u — v) . (F(w ) — (F( v )) > 0. 
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Cette terminologie est d’ailleurs assez mal- 
heureuse, puisque dans le cas d’une seule 
variable réelle elle amène à dire qu’une 
fonction croissante est monotone mais 
qu’une fonction décroissante ne l’est pas ! 
Il reste qu’elle est adoptée par tous les 
spécialistes. On dit que la fonction est 
strictement monotone si le seul cas d’éga- 
lité dans (14) est celui où u = v. 

Si F est linéaire par rapport à grad u, on 
peut écrire : 

F, (grad u) = ^ 

y-i 1 

La condition de monotonie signifie alors 
que la partie symétrique de la matrice des 
cijj est positive, et définie positive s’il y a 
monotonie stricte. On notera en particulier 
que dans le cas de l’équation de Poisson- 
Laplace c’est l’opérateur —A qui a la 
propriété de monotonie. 

Montrons que si F est strictement 
monotone, deux solutions du problème 
variationnel ne peuvent différer que par 
l’addition d’une constante. Soient U\ et 
u 2 ces deux solutions. Écrivons la rela- 
tion variationnelle (11) pour chacune 
des deux avec la même fonction v — — 

w 2 , puis retranchons l’une à l’autre les 
deux équations obtenues. Nous aboutis- 
sons à : 

(grad u i — grad u 2 ) 

X [F(grad u x ) — F(grad u 2 )] dx ~ 0. 

Si u l — u 2 n’était pas constante, la fonction 
à intégrer dans le premier membre de cette 
équation serait positive et non nulle et, par 
suite, l’intégrale strictement positive. 

Si F est strictement monotone, il suffit 
donc que l’espace V du problème varia- 
tionnel ne contienne pas de constante non 
nulle pour qu’il y ait unicité ; ce sera le cas 
si on a imposé la valeur de la solution sur 


une partie de la frontière. Dans d’autres 
cas, c’est la présence d’un terme en F 0 
strictement positif qui élimine la constante. 
Dans d’autres cas encore, tel celui du 
problème de Neumann, il existe bel et bien 
toute une famille de solutions différant 
deux à deux d’une constante. 

Avec des conditions d’uniformité de la 
monotonie et des conditions de continuité 
assez faibles pour pouvoir être vérifiées 
dans la plupart des problèmes usuels, on 
démontre l’existence d’une solution (théo- 
rème de Minty-Browder). La démonstra- 
tion, assez technique, se fait en deux 
étapes. La première consiste à démontrer 
l’existence dans le cas de la dimension 
finie. Elle s’appuie essentiellement sur un 
résultat de topologie algébrique (le « théo- 
rème des antipodes » de Borsuk). La 
seconde étape consiste à démontrer la 
convergence des approximations de Ritz- 
Galerkine. 

Formulation variationnelle 
et calcul des variations 

Dans de nombreux problèmes, parmi les- 
quels les plus fréquents dans les applica- 
tions, la formulation variationnelle 
exprime que la solution u est point critique 
d’une fonctionnelle J sur l’espace V. Ainsi 
du problème mêlé pour l’équation de 
Poisson-Laplace (et comme cas particu- 
liers des problèmes de Dirichlet et de 
Neumann). La fonctionnelle J est dans ce 
cas définie par la formule : 

J(w) = [^lê rad “II 2 + uf^dx + ug i dS. 

Les équations linéaires du second ordre 
pour lesquelles une telle fonctionnelle peut 
se trouver sont celles qui s’écrivent : 

div (A(x) . grad u) H- c(x)u + / — 0, 
où A est une matrice symétrique. 
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Lorsque cette fonctionnelle existe, on 
est donc ramené à un problème d’optimi- 
sation. La propriété de monotonie équi- 
vaut à la convexité de la fonctionnelle, qu’il 
s’agit donc de minimiser. 

La fonctionnelle J a souvent une inter- 
prétation comme énergie potentielle du 
système. Sa convexité indique donc la 
stabilité de la configuration d’équilibre, elle 
lui est même équivalente dans le cas 
linéaire. Dans les formulations variation- 
nelles, l’absence de fonctionnelle corres- 
pond souvent à une non-conservation de 
l’énergie, la condition de monotonie indi- 
quant qu’il y a dissipation. 

3. L'équation de la chaleur 

et le type parabolique 

Si les équations hyperboliques décrivent 
l’évolution des phénomènes physiques 
réversibles, les phénomènes irréversibles 
relèvent du type parabolique dont le pro- 
totype est l’équation de la chaleur, dite 
aussi de Fourier : 

(15) Ô ^ = A x u+f. 

Notons tout de suite qu’au contraire de 
l’équation des ondes cette équation est 
modifiée par le changement de t en — t. 

Elle décrit la diffusion de la chaleur, 
mais aussi bien d’autres phénomènes de 
diffusion, en particulier celle d’un corps en 
solution. 

Les problèmes bien posés typiques de 
l’équation de la chaleur, et des équations 
paraboliques en général, sont des problè- 
mes mixtes . On donne un ouvert O de 
l’espace et on cherche une solution u sur 
[0, oo[ X Q qui vérifie une condition 
initiale : w(0, x) = Uq(x), u {) fonction don- 
née et, à chaque instant f, une condition sur 


la frontière, condition de Dirichlet, ou de 
Neumann ou mêlée, d’autres parfois. La 
différence avec le cas hyperbolique est à 
chercher dans le comportement vis-à-vis de 
la variable temps. D’abord on ne donne ici 
que la valeur initiale de u et pas celle de sa 
dérivée. Ensuite, et c’est le plus important, 
la solution n’existe en général que dans le 
futur, c’est-à-dire pour les valeurs positives 
de t . On retrouve là l’opposition 
réversibilité-irréversibilité. La coexistence 
de données initiales et de données à la 
frontière d’un ouvert d’espace n’est pas 
essentielle : on la trouve aussi dans certains 
problèmes hyperboliques. 

Certaines propriétés de l’équation de la 
chaleur la rapprochent de l’équation de 
Laplace. Supposons pour le moment que 
f = 0 (c’est-à-dire qu’il n’y a ni source ni 
absorption de chaleur). Les solutions sont 
alors indéfiniment différentiables et, 
lorsqu’on fixe /, ce sont des fonctions 
analytiques de x. En particulier, la diffu- 
sion est instantanée dans ce sens que si 
dans un problème mixte la donnée initiale 
est nulle en dehors d’un voisinage d’un 
point, dès que t est strictement positif, il 
n’y a plus aucun point au voisinage duquel 
la solution reste nulle. Ce résultat peut 
aussi se déduire d’une version du principe 
du maximum adaptée à l’équation de la 
chaleur. 

Nous allons établir l’équation de la 
chaleur par un raisonnement qui, conve- 
nablement modifié, s’étend aux autres 
phénomènes de diffusion. Nous prendrons 
pour u la densité de l’énergie interne. /est 
celle des sources d’énergie thermique. 
Nous négligeons les effets dus à la dilata- 
tion thermique, autrement nous n’arrive- 
rions pas à (15) mais à un système où 
figurerait cette équation et celles de l’élas- 
ticité, le tout modifié par un couplage de 
ces équations entre elles. Nous désigne- 
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rons par v le flux d’énergie thermique. Le 
bilan d’énergie dans un domaine U nous 
donne ainsi : 

f u dx = f f dx — f v . n d S, 

où d\J désigne la frontière de U. Nous 
transformons une fois de plus l’intégrale de 
surface en intégrale de volume par une 
intégration par parties ; faisons passer la 
dérivation par rapport au temps sous le 
signe d’intégration (u peut-être supposée 
assez régulière pour que nous en ayons le 
droit) et obtenons : 

Lll 7 + * v < —/]* = <»• 

Comme cette équation doit être vraie pour 
tout domaine LJ, on en déduit : 

(16) — div x *=/. 

C’est Y équation de continuité dont la vali- 
dité est extrêmement générale : elle 
exprime simplement une loi de conserva- 
tion quelconque. 

Il faut maintenant une relation entre u 
et v. C’est la loi de diffusion proprement 
dite qu’on prend de la forme : 

(17) v = — K(*, u) . grad* u, 

où K est a priori une matrice. Les 
physiciens démontrent qu’elle est symétri- 
que. Elle est définie positive : cette 
propriété exprime que l’énergie thermique 
diffuse des régions les plus chaudes vers les 
plus froides et pas l’inverse. Dans un 
milieu isotrope, c’est simplement le pro- 
duit par un nombre. Si le milieu est 
homogène elle ne dépend pas de a\ Pour 
aboutir à l’équation ( 1 5) on suppose toutes 
ces propriétés vérifiées et on fait de plus 
l’hypothèse que K ne dépend pas non 
plus de w, ce qui est une approximation 
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justifiée dans les situations les plus usuel- 
les. Dans tous les cas, (16) et (17) se 
combinent en : 

(18) ~ = div (K(x, u) . grad u ) -f/. 

Si K est le produit par un nombre constant, 
un choix adéquat des unités donne la 
forme (15). 

Dans le raisonnement qui précède, 
on peut remplacer l’énergie interne par 
la concentration d’une solution sans 
rien changer d’autre. Des raisonnements 
analogues s’appliquent aux fluides cir- 
culant dans un milieu poreux. Très sim- 
ples dans le cas d’un liquide saturant 
les pores, les équations deviennent 
beaucoup plus compliquées dans le 
cas d’un gaz ou du mélange de deux 
fluides. 

On notera que (18) peut s’écrire : 
du 

- + A(«) = o, 

où A a la propriété de monotonie. C’est 
là la clef de propriétés d’existence et 
d’unicité pour les équations et systèmes 
paraboliques, sur lesquelles on revien- 
dra dans la partie C ci-dessous - Équations 
non linéaires. 

L’équation de la chaleur et les équa- 
tions analogues ont un lien étroit avec la 
théorie des probabilités. On ne s’en éton- 
nera pas puisque la relation (17) repose sur 
une théorie relevant de la physique statis- 
tique. 

Pour nous borner à un aspect assez 
simple de cette question, considérons des 
solutions de l’équation : 

(19) ï = KAü 

vérifiant une condition de décroissance à 
l’infini sur R” (par exemple intégrables). On 
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passe alors de la solution à l’instant t x à la 
solution à un instant ultérieur t 2 par la 
formule : 

(20) u (t 2 , .) = U, 2 _ fl « (t i, .), 

où U, est l 'opérateur dévolution , défini 
dans ce cas par la formule : 

n e - X -y -/ 4K/ 

(21) u,/»)°J g (4irK/) . /2 /Cr)<»- 

Cet opérateur transforme les mesures de 
probabilités sur R" en mesures de probabi- 
lités sur R” et les gaussiennes en gaussien- 
nes. C’est donc l’opérateur de transition 
d’un processus de Markov gaussien. 

Réciproquement, on vérifie que tout 
processus de Markov gaussien à accroisse- 
ments indépendants et stationnaires, com- 
mutant avec les déplacements de l’espace, 
est donné par les formules (20) et (21). 

En plus des équations de diffusion, les 
systèmes paraboliques comprennent les 
équations de Navier-Stokes pour un fluide 
incompressible : 

(22) p (S + Z Uy ë;) -MA " 

j 

= — grad p +/, 

où u est la vitesse du liquide, p sa pression, 
p sa densité, p son coeflicient de viscosité 
et/la force extérieure. De plus, on impose 
à u d’être de divergence nulle : c’est 
l’équation de continuité. 

4. Autres équations 

Équations qui changent de type 

L’équation de Tricomi : 


est hyperbolique dans le demi-plan x 2 < 0, 
elliptique dans le demi-plan x 2 > 0. 


En dehors de cela, le principal intérêt de 
l’équation de Tricomi est sa simplicité qui 
a permis d’en faire une étude assez 
détaillée. On rencontre un système présen- 
tant le même changement de type dans 
l’étude des écoulements stationnaires de 
fluides compressibles non visqueux. En 
admettant que l’équation d’état permet 
d’écrire la pression comme une fonction p 
de la densité, les équations du mouvement 
s’écrivent dans ce cas : 

du 

p y, u j àx- + p ( p ) srad p = °’ 

j } 

p div u + u . grad p = 0. 

Les notations ont le même sens que dans 
l’équation (22) ; p\ p) est le carré de la 
vitesse de propagation du son dans le 
fluide, on voit qu’elle dépend de x par 
l’intermédiaire de la densité. Dans la 
région subsonique, c’est-à-dire celle où 
| u || 2 < p\ p), le système est elliptique, il est 
hyperbolique dans la région supersonique, 
c’est-à-dire celle où ||w| 2 > //(p).Dans les 
équations et systèmes hyperboliques dont 
nous avons parlé jusqu’ici, la variable 
temps jouait un rôle privilégié ; ce rôle est 
tenu dans la région supersonique par le 
déplacement dans la direction de l’écou- 
lement. On peut d’ailleurs dans ce cas 
entendre la propagation des singularités 
dans la région hyperbolique : c’est le 
« bang » de l’avion passant le mur du son. 

Naturellement, c’est dans les régions 
comportant à la fois des parties superso- 
niques et des parties subsoniques que 
l’étude de l’écoulement est la plus délicate 
(régions transsoniques, fig. 3). L’étude de 
ces régions transsoniques connaît un 
regain d'intérêt car la hausse du prix du 
carburant a amené à renoncer, pour les 
avions de ligne du futur, aux vitesses 
supersoniques. 
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Photos prises en soufflerie, où les gradients de pression sont visualisés. On voit la différence entre un régime 
subsonique (en haut) et un régime transsonique (en bas). 


L'équation de Schrôdinger 

L’équation de Schrôdinger : 

-, du h 1 

ih~ — —-—Au + Vu 
ôt 2m 

décrit en physique quantique l'évolution de 
la fonction d'onde u d’une particule non 
relativiste de masse m soumise à un 
potentiel V. Elle n’est pas hyperbolique, ce 
qui semble mettre en défaut l’assertion 
selon laquelle la physique des phénomènes 
réversibles est décrite par des systèmes 
hyperboliques. Mais il ne faut pas oublier 
que l’équation de Schrôdinger apparaît 


comme une approximation à faible vitesse 
de l’équation de Dirac qui, elle, est un 
système hyperbolique. 

Malgré une certaine ressemblance for- 
melle avec l’équation de la chaleur, elle 
n’est pas non plus parabolique ; le facteur 
/ devant la dérivée par rapport au temps 
assure la réversibilité. 

L’équation de Schrôdinger n’appar- 
tient finalement pas à un type particulier 
d’équations. Malgré son importance 
physique, elle apparaît assez comme un 
cas particulier - au moins pour le 
moment. 
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Dans le même ordre d’idées, l’équation 
de Korteweg et de Vries et les autres 
équations « à solitons », dont les proprié- 
tés seront exposées dans la partie consa- 
crée aux problèmes non linéaires, ont des 
caractères analogues : elles ne sont pas 
hyperboliques mais liées à des équations 
hyperboliques. 

Equations générales 

Occupons-nous d’abord des équations aux 
dérivées partielles linéaires à coefficients 
constants du second ordre à trois variables 
indépendantes. Par un changement de 
variables, on peut toujours se ramener à un 
des trois cas suivants : 

a) la partie principale (homogène 
d’ordre deux) de l’équation est incomplète 
(c’est-à-dire qu’il n’y figure pas de dériva- 
tion par rapport à une des variables) ; 

b) cette partie principale est l’opéra- 
teur de Laplace, l’équation est elliptique ; 

c) la partie principale est l’opérateur 
des ondes (à deux dimensions d’espace), 
l’équation est hyperbolique. 

Si on passe à quatre variables indépen- 
dantes, un quatrième cas se présente, celui 
de l’équation : 

d 2 u d 2 u ô 2 u ô 2 u _ 

Ix] + Jx\ — Jx\ — 6x\ =i ' 

Cette équation est appelée ultra- 
hyperbolique par allusion au fait qu’il y a 
un signe de plus que dans l’équation des 
ondes. Mais cette expression ne désigne 
pas un type comme l’hyperbolique ou le 
parabolique ; c’est au fond une désignation 
purement négative. Elle ne correspond ni 
à des propriétés de problèmes bien posés 
ou à des singularités de solutions, ni à une 
famille qu’on saurait caractériser sur la 
forme de l’équation, y compris pour les 
ordres supérieurs à deux. 


Au demeurant, cette équation n’inter- 
vient pas dans des problèmes physiques. 

En principe, la théorie de Sato, 
Kashiwara et Kawai doit permettre une 
classification des systèmes linéaires aux 
dérivées partielles. Malheureusement, elle 
est d’un caractère tellement abstrait et 
détourné qu’on n’a encore guère vu 
d’application à un cas particulier non 
classique. 

MARTIN ZERNER 
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B. Théorie linéaire 

Il existe une théorie mathématique assez 
bien constituée des équations aux dérivées 
partielles linéaires, dont nous allons 
essayer de donner une idée. En contraste, 
les équations non linéaires présentent un 
foisonnement de problèmes et de métho- 
des dont peu sont générales. Sans que nous 
le précisions à chaque fois, certains des 
résultats que nous allons donner dans le 
cas linéaire se généralisent au non linéaire. 
Pourtant, même ceux-là font partie de la 
théorie linéaire, soit que la généralisation 
non linéaire soit limitée à des situations 
trop restrictives, soit qu’elle ne s’insère pas 
dans une théorie cohérente. 

Pour pouvoir conserver les notations de 
la partie précédente pour les problèmes 
d’évolution, nous nous placerons sur un 
ouvert de R" +1 (à l’occasion C n+1 ) et nous 
noterons en général y = (>’ 0 , y n ) les 
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coordonnées. Pour a E N' î+l , nous pose- 
rons : 


I a | = a; 

J-o 

y" =yÿ , yV -y Z" 

Ô !«i 

V a 

ôy g« ôy y> ... ôy g» 

Un opérateur linéaire aux dérivées 
partielles (on dit plus brièvement opéra- 
teur différentiel) est défini par un poly- 
nôme à coefficients pouvant dépendre 
de y : 

P(f.O= 

! a j < m 

il agit selon la formule : 

p«00= y b a V a u(y). 

| a | < m 

m s’appelle Y ordre de P. L’opérateur P HJ 
obtenu en ne gardant que les termes où la 
dérivation est d’ordre m exactement 
s’appelle la partie princiale de P. On notera 
V le gradient : 



(cf. calcul infinitésimal -Calcul à plu- 
sieurs variables). 

À côté de ces notations, il nous arrivera 
d’utiliser des notations en (/, x) où / ER 
(ou C) et a* E R" (ou C") avec des conven- 
tions analogues pour les multi-indices, 
puissances et dérivations. 

Nous ne nous priverons pas à l’occasion 
de noter les distributions comme des 
fonctions et les produits scalaires 
fonctions-distributions comme des intégra- 
les (cf. distributions). 


1 . Le théorème 
de Cauchy-Kovalevskaïa 


Supposons l’opérateur P de la forme : 


<‘> p " = iÉ + 



x, V,) 


dt 1 


k u 

— k * 


où les Q a sont des opérateurs différentiels 
d’ordre au plus k et où V Y désigne le 
gradient relativement à a*. 

Le problème de Cauchy s’énonce alors : 
« Trouver u vérifiant : 


(2) P u=f 

‘ Ô k U 

(3) -^(0,*) = g*(x) f k = 0, ..., m — 1, 


où / et g (h g \ , sont des fonctions 
données. » 

Le théorème de Cauchy-Kovalevskaïa 
suppose que les coefficients de P ainsi que 
les données / g 0 , ... ,g m j sont des fonc- 
tions analytiques (réelles ou complexes) de 
t et de x. 11 affirme alors l’existence d une 
solution analytique et une seule sur un 
voisinage de tout point (0, x 0 ). Ce voisi- 
nage dépend de P et des domaines d’ana- 
lyticité complexes des données. 

Ce théorème s’applique aussi aux sys- 
tèmes, pourvu qu’ils soient de la forme : 


où est une fonction analytique de /, .y, u 
et ses dérivées d’ordre total m au plus mais 
strictement plus petit que m en /. Il reste 
un des rares résultats très généraux de la 
théorie. Il a été publié par Cauchy en 1842 
dans les Comptes rendus de F Académie des 
sciences. 

Le travail de Sofia Kovalevskaïa est 
paru en 1874; apparemment elle ne 
connaissait pas celui de Cauchy (et son jury 
non plus puisqu’il s’agissait d’une thèse !). 
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La démonstration d’unicité est simple 
et instructive. Si u est une solution analy- 
tique, elle possède un développement de 
Taylor en t : 


u(t,x) 



gk(x) = 


ô k u 

ôt k 


(Q,x) 


pour tout k positif cette fois. Les g k sont 
donnés pour k < m. En faisant t = 0 dans 
l’équation aux dérivées partielles, on 
trouve : 

m— 1 

=/— ^ Q w _^(0,X, 

k = 0 


ble pour l’époque par la façon dont elle 
met enjeu des idées de l’analyse moderne : 
dualité et densité. 

Le résultat de Holmgren a été étendu 
par Hormander aux solutions distributions. 
Il est nécessaire dans ce nouveau cadre de 
reformuler le problème, puisque la restric- 
tion d’une distribution à l’hyperplan t = 0, 
qui intervient dans les données de Cauchy, 
n’a a priori pas de sens. Notons 0 la fonc- 
tion qui vaut 0 pour t < 0 et 1 pour t ^ 0, 
et Ô la distribution de Dirac. La fonction u 
vérifie les conditions (2) et (3) si et seule- 
ment si on a l’équation entre distributions : 


P(ô«) = 6/ 

m — k m — k 


'(*)■ 


.. =0 / = 1 
avec la convention Q 0 = 1 


En dérivant l’équation (2) par rapport à t 
et en y faisant t = 0, on trouve des 
formules analogues donnant chaque g k en 
fonc- 
tion de ceux d’indices strictement plus 
petits. 

La démonstration d’existence consiste 
essentiellement à démontrer la conver- 
gence de la série ainsi calculée. Elle repose 
sur une technique de majoration établie 
par Cauchy à cette occasion (méthode des 
séries majorantes). 

La même démonstration s’applique 
d’ailleurs au système non linéaire (4) 
moyennant des complications légères. 

Unicité de la solution distribution 

Le théorème de Cauchy-Kovalevskaïa 
n’exclut pas l’existence de solutions non 
analytiques au problème de Cauchy. Cette 
lacune a été comblée, en 1901 par le 
théorème de Holmgren qui affirme l’unicité 
des solutions « classiques » (c’est-à-dire m 
fois différentiables). Très élégante, la 
démonstration de Holmgren est remarqua- 


En généralisant cette formule, on est 
amené à poser le problème de Cauchy de 
la façon suivante : « Trouver une distribu- 
tion u à support contenu dans le demi- 
espace t > 0 qui vérifie : Pu = T, T 
distribution donnée à support contenu 
dans ce même demi-espace. » 

L’unicité de la solution du problème de 
Cauchy devient ainsi une affirmation sur le 
support des distributions qui vérifient 
l’équation : 

(5) Pw = 0. 

Si le support d’une telle distribution est 
contenu dans le demi-espace fermé t > 0, 
il est aussi contenu dans le demi-espace 
ouvert / > 0. 

Le problème de Cauchy 
en coordonnées générales : 
hypersurfaces caractéristiques 

Dans certaines situations, on a besoin 
d’étudier un problème de Cauchy où les 
données, au lieu d’être portées par l’hyper- 
plan t = 0, le sont par une autre hyper- 
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surface Z. Il y a donc lieu de voir si on peut 
trouver des coordonnées (/, a) telles que : 

a) l’opérateur P prend la forme (1) au 
produit près par une fonction non nulle 
(nous pourrons diviser le second membre 
par cette fonction) ; cela revient à dire que le 
coefficient de ( ô m u)/(ôt m ) ne s’annule pas ; 

b) l’équation de Z devienne t — 0. 

Supposons donc que Z soit définie par 

une équation S (y) — 0, où S est une 
fonction analytique dont le gradient ne 
s’annule pas. Nous prenons pour nouvelles 
coordonnées t = S (y) et des fonctions 
..., x„ de façon que l’ensemble (r, a) fasse 
un système de coordonnées. Un calcul 
sans histoire montre que le coefficient de 
(d m u)/(dt m ) est : 

(6) P^O, gradS(y)). 

Trois cas peuvent alors se présenter. 

Le premier cas est dit non caractéristi- 
que : l’expression (6) est non nulle ; le 
théorème de Cauchy-Kovalevskaïa et celui 
de Holmgren s’appliquent au problème de 
Cauchy avec données portées par Z. 

Le deuxième cas est le cas caractéristi- 
que, c’est-à-dire que l’équation : 

P m (y, grad S(y)) — 0 

est vérifiée. On dit que Z est une hyper- 
surface caractéristique . On peut démontrer 
dans ce cas que l’équation ; 

(7) P(y, V)w = 0 

a des solutions dont le support a Z pour 
frontière, et des solutions dont les singu- 
larités sont portées par Z. 

Il reste des cas intermédiaires où 
l’expression (6) s’annule, mais pas identi- 
quement. C’est le plus délicat. Il y a lieu à 
ce sujet de signaler les résultats de Leray 
sur l’uniformisation du problème de Cau- 
chy : la solution se ramifie autour de la 
variété où l’expression (6) s’annule. 


Un point important à retenir est que 
les hypersurfaces qui peuvent faire partie 
de la frontière du support d’une solution 
de l’équation (7) sont les caractéristiques. 
Un autre est la caractérisation des équa- 
tions elliptiques : elles n’ont pas de carac- 
téristiques réelles. Dans le cas elliptique, 
il n’y a pas d’hypersurfaces pour limiter 
le support des solutions de (7), et pour 
cause : on démontre qu’elles sont analyti- 
ques. 

Les limitations du théorème de Cauchy- 
Kovalevskaïa ont été mises en lumière de 
façon particulièrement claire par Hada- 
mard dans ses Leçons sur le problème de 
Cauchy (publiées à Yale en 1923 et à Paris 
en 1932). Elles portent sur trois points liés 
entre eux qui rendent le résultat inopérant 
dans les applications physiques : 

- sa nature très locale ; 

- l’hypothèse d’analyticité des données ; 
les situations physiques où l’analyticité est 
une propriété naturelle sont rares et en tout 
cas ce ne sont pas celles où se posent des 
problèmes de Cauchy ; 

- conséquence des deux circonstances 
précédentes, une instabilité de la solution : 
si on modifie les données en leur ajoutant 
des fonctions analytiques si petites soient- 
elles, on perd tout contrôle de la solution, 
et même de son domaine d’existence, si on 
ne connaît pas le domaine d’analyticité 
complexe de la perturbation. 

Ces limitations expliquent l’importance 
des équations hyperboliques définies 
comme celles où il y a encore existence 
pour le problème de Cauchy à données 
indéfiniment différentiables (ou à données 
distributions : si le passage de l’analytique 
au différentiable implique dans ce pro- 
blème une différence essentielle, le passage 
des fonctions différentiables aux distribu- 
tions est au contraire automatique pourvu 
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que les coefficients soient eux-mêmes indé- 
finiment différentiables). 


2. Problèmes de régularité 

On a déjà signalé que si P est un opérateur 
elliptique à coefficients analytiques et u une 
distribution vérifiant l’équation (2), u est 
analytique sur tout ouvert où / l’est. De 
plus, cette propriété caractérise les opéra- 
teurs elliptiques. 

On dit que l’opérateur P est hypoellip- 
tique si toute u vérifiant (2) est indéfini- 
ment différentiable sur tout ouvert où le 
second membre / est indéfiniment diffé- 
rentiable. 

Dans sa thèse, Hôrmander a donné 
la caractérisation suivante des opéra- 
teurs hypoelliptiques à coefficients cons- 
tants : 

Pour tout a différent de 0 on a : 
lim V°P(0/P© = 0. 

La dérivée est évidemment prise par rap- 
port à ç : c’est la seule variable dont dépend 
P puisque les coefficients sont constants. 
L’intervention de ces dérivées est assez 
naturelle du fait qu’on cherche à localiser 
les propriétés de u en multipliant cette 
distribution par une fonction indéfiniment 
différentiable à support borné. On utilise 
alors la généralisation de la formule de 
Leibniz, valable pour tout opérateur dif- 
férentiel linéaire : 

P(<p«)= 

P ^ m 

où (3 ! désigne le produit des factorielles de 

a- 

Pour les opérateurs à coefficients varia- 
bles (indéfiniment différentiables), on ne 
connaît que des conditions suffisantes 


d’hypoellipticité. Une de ces conditions 
s’exprime sur les opérateurs « à coeffi- 
cients gelés », c’est-à-dire les opérateurs à 
coefficients constants obtenus, pour cha- 
que point en remplaçant les coefficients 
variables b par leur valeur b(y) désormais 
fixée. La condition est que chacun de ces 
opérateurs soit hypoelliptique et qu’ils 
aient tous le même domaine dans L 2 . Une 
faiblesse de cette condition (obtenue à peu 
près simultanément par Hôrmander et 
Malgrange) est qu’elle n’est pas conservée 
par les changements de coordonnées, 
comme le montre l’exemple de 1 ’équation 
de la chaleur. 

Par la suite, Hôrmander a étudié les 
opérateurs de la forme : 

k 

P = X X ' 2 + X ° + c ’ 

7 = 1 

où c est une fonction indéfiniment diffé- 
rentiable et X 0 , X L , ..., X* des opérateurs 
d’ordre un sans terme d’ordre zéro : 
chacun de ces opérateurs est donc défini 
par un champ de vecteurs (cf. la partie A 
ci-dessus - Sources et applications). Dési- 
gnons par [X y , XJ le commutant X k X { — 
XjX k ; c’est encore un opérateur de la 
même nature et le champ de vecteurs qui 
lui correspond est le crochet des deux 
autres champs de vecteurs au sens de la 
géométrie différentielle. Nous noterons 
désormais de la même façon opérateurs du 
premier ordre et champs de vecteurs. 
Appelons encore S le plus petit espace 
vectoriel stable par le crochet auquel 
X 0 , X], ..., X k appartiennent et r(> ? ) la 
dimension de l’espace vectoriel formé par 
les valeurs au point y des champs appar- 
tenant à S. Cet entier r(y) prend son 
maximum m sur un ouvert non vide. Si m 
est strictement plus petit que la dimension 
n -(- 1 de l’espace, l’opérateur P n’est pas 
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hypoelliptique. En effet, d’après le théo- 
rème de Frobenius, on peut trouver un 
système de coordonnées locales dans 
lequel P ne contient pas de dérivations par 
rapport à certaines des variables. Horman- 
der démontre une réciproque partielle : si 
on a partout r(y) = n + 1 , alors P est 
hypoelliptique. 


3. Solutions élémentaires 
et paramétrix 

On dit qu’une distribution de deux varia- 
bles E est un noyau élémentaire de P si elle 
vérifie la relation : 

P v E(y,z) = 5(y — z) 

qui entraîne, du moins pour /à support 
compact, que la distribution : 

u(y)=\ j ^^(y,z)f(z)dz 

vérifie l’équation (2), d’où la précision 
noyau élémentaire à droite qu’il est pru- 
dent d’apporter, sauf, comme nous le 
verrons, dans le cas des équations à 
coefficients constants. 

Nous avons déjà rencontré un tel noyau 
(cf. chap. 3 L'équation de la chaleur et le 
type parabolique , dans la partie A 
ci-dessus - Sources et applications, à pro- 
pos du mouvement brownien). En effet les 
formules (20) et (21) de cette partie 
montrent que le noyau : 

E (t u x l ,t 2 ,x 2 ) = (4tt (ti—t 2 ))~ n/2 
exp ( — 1 jc i — * 2 || 2 /4 

où 0(/ ) = 1 pour t positif et 0 sinon, est 
un noyau élémentaire pour l’opérateur de 

la chaleur -A A r 

dt 

Le plus ancien exemple de noyau élé- 
mentaire connu est sans aucun doute celui 


du potentiel coulombien — l/47ij|y — z||, 
noyau élémentaire de l’opérateur de 
Laplace en dimension 3. 

Opérateurs à coefficients 
constants et convolution 

Un opérateur différentiel à coefficients 
constants est un opérateur de convolution 
puisqu’il commute avec les translations. 
Plus précisément : 

p« = Pô * u . 

Les noyaux élémentaires les plus com- 
modes s’écrivent alors eux aussi comme 
noyaux de convolution E( v — z), où E, qui 
ne dépend plus que d’une variable dans 
R"+i, est une solution élémentaire , c’est- 
à-dire qu’elle vérifie : 

PE = 5. 

L’utilisation systématique de ce point 
de vue est un des traits caractéristiques du 
développement qu’a connu l’étude des 
équations aux dérivées partielles dans les 
années 1950 sous l’impulsion de la théorie 
des distributions. En particulier, Mal- 
grange a démontré en 1953 que tout 
opérateur différentiel à coefficients cons- 
tants non nul avait une solution élémen- 
taire. 

Solution élémentaire et hypoellîpticité 

Si P est un opérateur à coefficients cons- 
tants hypoelliptique, ses solutions élémen- 
taires doivent évidemment être indéfini- 
ment différentiables en dehors de l’origine. 
Mais la réciproque est aussi vraie comme 
on va le voir. Il faut savoir que si T est une 
distribution indéfiniment différentiable en 
dehors de l’origine, alors, pour toute dis- 
tribution /’ le produit de convolution T * / 
est indéfiniment différentiable sur tout 
ouvert où /l’est, pourvu qu’une au moins 
de ces deux distributions soit à support 
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compact. Supposons donc que P ait une 
solution élémentaire E indéfiniment diffé- 
rentiable en dehors de l’origine, et soit cp 
une fonction indéfiniment différentiable à 
support compact qui vaut 1 sur un voisi- 
nage de l’origine. Posons : 

F = cpE. 

Il est facile de s’assurer que : 

PF = ô + y, 

où \\) est indéfiniment différentiable à 
support compact. On a donc : 

F */ = F * Pô * w = u + 

la deuxième égalité à cause de l’associati- 
vité, et la commutativité du produit de 
convolution assurées du fait que u est le 
seul des trois facteurs à ne pas avoir un 
support compact. Comme ip * u est indé- 
finiment différentiable, on voit que u est 
indéfiniment différentiable sur tout ouvert 
où /est indéfiniment différentiable. 

La distribution F utilisée dans cette 
démonstration est ce qu’on appelle une 
paramétrix. Le terme n’a pas de définition 
mathématique précise et universellement 
admise. Il signifie que PF est la distribution 
de Dirac plus « quelque chose de pas 
méchant », cette dernière expression dési- 
gnant en général une fonction assez régu- 
lière. 

Le résultat que nous venons de donner 
et sa démonstration s’étendent aux opéra- 
teurs à coefficients variables moyennant 
des complications techniques assez sérieu- 
ses. 

Solution élémentaire et hyperbolicité 

On se souvient que la formulation du 
problème de Cauchy en théorie des distri- 
butions amène à étudier l’équation aux 
dérivées partielles en supposant que 
second membre et solution ont leur sup- 


port dans le « futur » (c’est-à-dire le demi- 
espace t > 0). Si P est hyberbolique, il faut 
en particulier (puisque le second membre 
peut être la distribution de Dirac) qu’il 
existe une solution élémentaire dont le 
support est contenu dans ledit futur (dans 
le cas des coefficients variables, un noyau 
élémentaire dont le support est contenu 
dans l’ensemble des couples (>’, z) tels que 
y soit dans le futur de z). 

Inversement, supposons que l’hyper- 
plan t — 0 soit non caractéristique et qu’il 
existe une solution élémentaire E à support 
dans le futur. Supposons aussi, mais uni- 
quement pour simplifier, que P soit à 
coefficients constants. Le théorème de 
Holmgren assure alors que l’hyperplan 
t = 0 n’a que l’origine en commun avec le 
support de E. Il y a plus : l’intersection de 
ce support avec tout hyperplan t = C e est 
un compact. Il en résulte que le produit de 
convolution E * T est défini pour toute 
distribution à support dans le futur. Il 
résout le problème de Cauchy et par 
conséquent P est hyperbolique. 

C’est la construction de solutions élé- 
mentaires qui a permis la démonstration 
d’existence dans le problème de Cauchy 
pour les opérateurs hyperboliques du 
second ordre à coefficients variables, quel- 
ques dizaines d’années avant que la théorie 
des distributions vienne fournir le cadre 
général dans lequel cette méthode s’insère 
aujourd’hui. 

Solution élémentaire et répartition 
asymptotique de valeurs propres 

Soit A un opérateur elliptique du second 
ordre ; pour étudier le problème de Diri- 
chlet, restreignons-le aux fonctions qui 
s’annulent sur la frontière d’un ouvert 
borné Q ; on obtient ainsi un opérateur 
auto-adjoint dans L 2 (Q) et cet opérateur 
est anticompact, c’est-à-dire que si un 
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nombre X n’est pas valeur propre de A, 
alors (A — XI) -1 est un opérateur compact. 
Supposons-le inversible pour simplifier. 
Un noyau élémentaire, qui résout le pro- 
blème de Dirichlet, est alors donné par la 
formule : 

G (*>y)= 'y'—K' l Vk(?c)Vk Q)> 

où on a désigné par — X k les valeurs 
propres de A (elles sont négatives, sauf 
peut-être un nombre fini d’entre elles) et 
par \p k une fonction propre normée asso- 
ciée à X k . Un tel noyau élémentaire qui 
résout un problème aux limites est en 
général appelé noyau de Green. Supposant 
les X* rangées par ordre croissant, nous 
allons nous intéresser à leur répartition 
asymptotique. 

Pour avoir une idée de la difficulté de ce 
problème, on peut considérer le cas très 
simple où A est le laplacien et Q un carré 
de côté 1. Les X* sont alors les nombres : 
7r 2 («j + n\), n x et n 2 entiers, ce qui nous 
ramène à un problème célèbre en théorie 
des nombres, le nombre de points de 
coordonnées entières contenus dans un 
cercle de rayon r. Notons N (r) le nombre 
de valeurs de k telles que : 

VT k < r. 

Tl est facile de voir que : 

(8> N(r) = £i + 0(r 2 ) . 

À la suite d’une série de travaux dont 
les premiers sont dus à Hermann Weyl, 
la partie principale de N (r) est connue 
pour des problèmes elliptiques très géné- 
raux. 

On se rendra compte que l’évaluation 
du terme en o(r 2 ) dans la formule (8) est un 
problème très difficile si on sait que, dans 
ce simple cas particulier, de grands efforts 
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ont été accomplis par les théoriciens des 
nombres pour obtenir son ordre de gran- 
deur et que pourtant l’exposant de r n’y est 
pas encore exactement connu. 

Un premier outil pour aborder ce 
problème s’obtient en évaluant la fonc- 
tion : 

e~ n dN(r 2 ) — e ~ kk ! — S (t). 

C’est la trace (somme des valeurs propres) 
de l’opérateur U, associé à l’équation 
parabolique : 

(9) g = A «. 

en posant : 

U ,*(.) = u(t , .), 

où u vérifie (9) et u( 0, .x) = g(.x). La trace 
s’obtient en intégrant le noyau de U, sur la 
diagonale. Le noyau de U„ que nous 
noterons U(/, x, y) s’écrit : 

U vpfc(x) VaQ), 
de sorte que : 

S(r) = J U (t,x,x)dx. 

Dans un travail paru en 1973, Colin de 
Verdière a mis ces idées en œuvre dans un 
contexte légèrement différent : A est l’opé- 
rateur de Laplace-Beltrami sur une variété 
riemannienne compacte X. Une construc- 
tion par approximations successives de U 
lui permet de montrer que l’existence de 
géodésiques fermées et leur longueur 
influent sur le comportement asymptoti- 
que des valeurs propres. 

Immédiatement après, Chazarain, 
d’une part, et Duistermat et Guillemin, 
d’autre part, ont obtenu des résultats 
analogues par une méthode légèrement 
différente dans laquelle la cause de l’inter- 
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vention des géodésiques fermées est plus 
apparente. Elle s’obtient en complétant N 
par antisymétrie (N(— r) — — N(r)) et en 
prenant la transformée de Fourier de sa 
dérivée : 


1 

VT 7 


je^d N(X) « ^ cos Vk k t = T (/ ), 


équation purement symbolique entre 
distributions. La distribution T ainsi obte- 
nue est associée à l’opérateur hyperboli- 
que : 


d*_ 

df 2 


A 


= P, 


comme la fonction S l’était à un opérateur 
parabolique. En effet, si on définit l’opé- 
rateur V, en posant : 


où u est la solution du problème de 
Cauchy : 


P« =0 


d u 

JJ 


(0,x) 


o, 


on trouve que T est la « trace-distribution » 
de V,. En fait, V, n’est pas un opérateur à 
trace, mais, pour cp indéfiniment dérivable 
à support compact, 

JV)V,<ir 


ractéristiques), on ne s’étonnera pas des 
deux résultats suivants : 

les bicaractéristiques de P s’obtiennent 
en parcourant à une vitesse unité les 
géodésiques de X ; 

- les singularités de V, se propagent selon 
ces bicaractéristiques. 

En particulier, si X possède une géo- 
désique fermée de longueur L, on va voir 
revenir une singularité dans V, avec une 
période L. Ce type de résultats a été 
étendu par la suite, en particulier au 
problème de Dirichlet. Le rôle des géo- 
désiques fermées est alors joué par les 
lignes polygonales qui se referment par 
réflexion sur la frontière. On en déduit 
(pas directement !) que les singularités de 
T sont des points de la forme k L. Ce qui 
se traduit enfin sur le comportement 
asymptotique de N en vertu d’un des 
aspects de la dualité régularité locale- 
décroissance à l’infini dans la transforma- 
tion de Fourier. 


4. La transformation de Fourier 
et ses généralisations 

Nous emploierons les notations suivantes 
pour la transformation de Fourier : 

*/© =/ «) = 


en est un et sa trace n’est autre que : 

J T(/ ) <f(t ) dt. 

On remarquera que V, s’obtient à partir 
d’une solution élémentaire de P en déri- 
vant par rapport à t. 

Si on se rappelle ce qui a été expliqué 
(cf. chap. 1 L’équation des ondes et le type 
hyperbolique , dans la partie A ci-dessus - 
Sources et applications, au sujet des bica- 


où n est la dimension de l’espace (cf. dis- 
tributions, chap. 4, et analyse harmoni- 
que, chap. 3). 

Il en résulte que : 

= */(£); 

en d’autres termes, la transformation de 
Fourier transforme la dérivation partielle 
en produit par la variable correspondante, 
au facteur i près. Si P est un opérateur 
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différentiel à coefficients constants et u et f 
des distributions tempérées, l’équation aux 
dérivées partielles (2) équivaut à : 

P (/£)«(£) =/(£). 

Nous utiliserons le fait que la transfor- 
mation de Fourier est inversible et a pour 
inverse $ définie par : 

**(*) = ë J <r "' < '•' > «(0 

et le théorème de Parseval, étroitement lié 
au résultat précédent : $ est une isométrie 
de L 2 (R"). 

Une conséquence simple de ces résul- 
tats est que la transformation de Fourier et 
son inverse ont exactement les mêmes 
propriétés. 

La dualité 

régularité locale-décroissance à l'infini 

La transformée de Fourier d’une fonction 
intégrable est bornée. Si une fonction a des 
dérivées intégrables, sa transformée de 
Fourier décroît donc comme 1/||£||, et si 
elle a des dérivées d’ordre k intégrables sa 
transformée de Fourier décroît à l’infini en 
\\c,\\~ k . Inversement, si la transformée de 
Fourier û de u décroît à l’infini comme 
1 1, u a des dérivées jusqu’à l’ordre 
k — n — 1 qui sont continues et bornées. 

Le décalage disparaît, grâce au théo- 
rème de Parseval, si on considère les 
fonctions de carré intégrable. Ainsi u 
appartient à l’espace de Sobolev H 1 (R 1 *) 
(cf. chap. 2 Le type elliptique , dans la partie 
A ci-dessus - Sources et applications) si et 
seulement si sa transformée de Fourier est 
de carré intégrable pour la mesure 
(1 + || t, |p) dC Ce résultat fournit la défi- 
nition la plus simple de l’espace de Sobolev 
d’indice réel quelconque : une fonction 
appartient à l’espace H s (R n ) si sa trans- 
formée de Fourier est de carré intégrable 


pour la mesure (1 + || Ç |p) v de,. L’introduc- 
tion d’indices non entiers est nécessaire 
surtout du fait que, pour s > 1/2, on 
sait définir la restriction à un hyper- 
plan d’une fonction appartenant à FF, et 
cette restriction appartient à H y 1/2 ; 
de plus, toute fonction appartenant à 
H-v-h 2 fhyperplan est restriction d’une 
fonction appartenant à FF de l’espace 
ambiant. 

Un cas extrême de décroissance à 
l’infini est donné par un support compact. 
Il lui correspond du côté Fourier une 
propriété d’analyticité : une distribution 
est à support compact si et seulement si sa 
transformée de Fourier se prolonge en une 
fonction analytique sur C n tout entier à 
croissance exponentielle à l’infini (théo- 
rème de Palcy Wiener généralisé). Il est 
bon de remarquer ici que la croissance 
exponentielle à l’infini de l’extension à C n 
apparaît en même temps comme une 
propriété locale de la fonction puisqu’on 
peut la caractériser sur la suite des dérivées 
en un point via le développement de 
Taylor. 

Propriétés des solutions élémentaires 

Tout polynôme non nul possède un inverse 
multiplicatif qui est une distribution tem- 
pérée. Par transformation de Fourier, cela 
revient à dire que tout opérateur différen- 
tiel à coefficients constants possède une 
solution élémentaire tempérée. 

Voyons d’abord comment ce résultat 
permet de démontrer Thypoellipticité des 
opérateurs elliptiques. Soit P un tel opé- 
rateur. L’ellipticité signifie que la partie 
principale P,„(£) n’a pas de zéro réel non 
nul et, par homogénéité, il en est de même 
de P ,„(/£). Soit E une solution élémentaire 
tempérée. On a pour tout a : 

V U Ê = Q u /P M + 1 
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où Q a est un polynôme de degré 
\a\{m — 1 ). Par conséquent, V a Ê décroît 
à l’infini comme l/||^|f" +iw L En particulier, 
A k Ê décroît comme ||Ç|| {m + 2k \ ce qui 
montre, en revenant « côté a* », que || a |p*E 
est m + 2k — n — 1 fois continûment déri- 
vable et, par division, que E est m + 2k — 
n — 1 fois dérivable en dehors de l’origine. 
Mais k peut être choisi aussi grand qu’on 
veut, d’où l’indéfinie différentiabilité de E 
en dehors de l’origine. 

Ce raisonnement s’adapte d’ailleurs au 
cas général des opérateurs hypoelliptiques 
à coefficients constants, à condition de 
savoir que, si P(V) est hypoelliptique, P (/£) 
croît à l’infini comme une puissance stric- 
tement positive de || t 1|. Cette propriété se 
démontre grâce à une combinaison du 
développement de Puiseux et du théorème 
de Tarski-Seidenberg (l’image par une 
application polynomiale d’un ensemble 
défini par des équations et inéquations 
polynomiales est un ensemble de même 
nature). 

Passons aux opérateurs hyperboliques. 
Il s’agit ici de savoir s’il y a une solution 
élémentaire dont le support est contenu 
dans le demi-espace t ^ 0 et qui coupe 
tout hyperplan t = C e selon un compact. 
Le résultat essentiel est une généralisation 
du théorème de Paley Wiener, le théorème 
de Plancherel. Sous sa forme la plus 
simple, il dit qu'une distribution tempérée 
d’une variable est à support contenu dans 
la demi-droite .v > a si et seulement si sa 
transformée de Fourier est limite, pour n 
tendant vers 0, d’une fonction F analytique 
dans le demi-plan complexe r| > 0 qui 
vérifie une inégalité : 

F(£ + /n) < Cii\ k e— ar] . 

À plusieurs variables, le théorème exprime 
une dualité entre distributions à sup- 


port dans un convexe et fonctions ana- 
lytiques sur R ff +iT vérifiant une condi- 
tion de croissance, où T est un cône 
convexe. 

On conçoit donc que P sera hyper- 
bolique si P(/t, ii) est non nul sur un 
ensemble R” +1 -f- /T. Toutefois, sous cette 
forme, la condition n’est pas nécessaire 
parce que la solution élémentaire à support 
dans le futur peut ne pas être tempérée. 
Une condition nécessaire et suffisante 
d’hyperbolicité est que l’hyperplan / = 0 
soit non caractéristique et qu’il existe r 0 tel 
que : 

P(t + / r", / pour t' > t 0 . 

Mais cette condition est équivalente à la 
condition apparemment plus forte : il 
existe r 0 et un cône convexe ouvert T tels 
que : 

P(t' + / t", n + /Q ^ 0 

pour r' > t 0 et ne T. 

Une condition nécessaire plus simple 
est que, pour tout t, réel, le polynôme en 
r P,„(t, Ç) ait toutes ses racines réelles ; une 
condition suffisante est que, de plus, ces 
racines soient simples pour t; 0. Ces 
conditions portant sur la partie principale 
se généralisent aux opérateurs à coeffi- 
cients variables. 

Opérateurs pseudo-différentiels 
et opérateurs intégraux de Fourîer 

On voit qu’on dispose d’outils puissants 
pour l’étude des équations aux dérivées 
partielles à coefficients constants. Le pas- 
sage aux coefficients variables a souvent 
consisté à se ramener aux coefficients 
constants. L’idée est que, les coefficients 
étant continus, localement l’équation est 
assez proche d’une équation à coefficients 
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constants, ce qui permet soit des majo- 
rations, soit des approximations successi- 
ves. 

À partir des années 1960, on a déve- 
loppé des outils permettant de travailler 
plus systématiquement sur les équations à 
coefficients variables. Grâce aux proprié- 
tés de la transformation de Fourier, on 
peut écrire : 

(10) P u(x) = 

( 27 r)“ fl ff e i<Lx— y> J>(x,iÇ)u(y)dt > dy. 

J J R" X R» 

On généralise cette formule en n’y suppo- 
sant plus que P soit un polynôme en On 
dit qu’on a affaire à un opérateur pseudo- 
différentiel d’ordre m s’il vérifie les inéga- 
lités : 


formule ( 10) la phase < C x — y > par une 
fonction plus générale. 

Un cas particulier de cette méthode 
avait été employé par les physiciens en 
optique ondulatoire, c’est le développe- 
ment en ondes sphériques. Pour une onde 
monochromatique : 

u(t,x) — e iü)t v(x), 

l’équation des ondes devient l’équation de 
Helmholtz : 

(1 1) Av + k 2 v = 0, 

où k = o )/c. Cette équation admet la 
solution élémentaire : 


d’où des solutions de la forme 


sup 

xeK 


V“ V?P(x, O 


<c K , a>p |uh-^, 


— 1 
4 tr 



i f(y)dy 


pour tout compact K et tout £ différent 
de 0. Le cas effectivement utilisé est celui 
où P est somme d’une fonction positi- 
vement homogène de degré m en Ç et 
d’un deuxième opérateur pseudo- 
différentiel d’ordre strictement plus petit 
que m. 

Les opérateurs pseudo-différentiels 
permettent de plonger les opérateurs 
différentiels dans une algèbre où se trou- 
vent aussi leurs paramétrix. Ils jouent ainsi 
le rôle qui est pour les opérateurs à 
coefficients constants, celui de la convo- 
lution. Ce cadre est très bien adapté au 
calcul de paramétrix, du moins dans le cas 
elliptique. Dans les autres cas, on en tire 
parti en passant au point de vue micro- 
local. 

L’étape suivante est le passage aux 
opérateurs intégraux de Fourier. La géné- 
ralisation consiste à remplacer dans la 


(il s’agit soit de l’équation avec second 
membre correspondante, soit plus souvent 
de fonctions qui vérifient ( 1 1) en dehors du 
support de/). Une intégration par rapport 
à k permet de passer à d’autres solutions 
de l’équation des ondes. 

MARTIN ZERNER 
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C. Équations non linéaires 

L’étude des équations aux dérivées par- 
tielles non linéaires se trouve à Y interface 
de nombreux problèmes scientifiques. En 
effet, la plupart des phénomènes de la 
physique ou des sciences de l’ingénieur 
sont non linéaires et une modélisation par 
des équations linéaires risque, dans cer- 
tains cas, d’effacer des événements que les 
équations linéaires ne peuvent pas prendre 
en compte. Inversement, on peut dire que 
c’est l’existence de ces phénomènes nou- 
veaux - apparition de chocs ou de singu- 
larités, comportement asymptotique pro- 
fondément différent de celui des 
problèmes linéaires - qui rend la théorie 
difficile et qui conduit à faire appel à un 
arsenal mathématique très vaste. L’inte- 
raction avec le reste de la mathématique 
se fait aussi en sens inverse, car un certain 
nombre de problèmes abstraits se traitent 
à l’aide d’équations aux dérivées partielles 
non linéaires. Les liens avec l’analyse 
numérique sont continuels, et s’effectuent 
dans les deux sens. D’une part, on utilise 
l’analyse des équations aux dérivées par- 
tielles non linéaires pour construire des 
algorithmes numériques utilisés de plus en 
plus systématiquement. D’autre part, on 
se sert de l’ordinateur comme outil 
d’investigation. On effectue des calculs 
approchés concernant des phénomènes 
sur lesquels on ne possède que très peu 
d’information et, de ces calculs approchés, 
on déduit des conjectures que l’on s’effor- 
cera par la suite de démontrer. Cette 
démarche, pressentie par John von Neu- 
mann, s’est révélée particulièrement 
féconde. 

Bien entendu, un certain nombre de 
questions propres aux problèmes linéaires 
peuvent se généraliser aux problèmes non 
linéaires si, d’une part, les perturbations 


dues aux non-linéarités sont petites, et si, 
d’autre part, la structure des problèmes 
linéarisés correspondants introduit assez 
de régularité. 11 en est ainsi des théorèmes 
d’existence des solutions de systèmes ellip- 
tiques ou paraboliques non linéaires et du 
comportement asymptotique de solutions 
d’équations du type : 

^-A« + F(«) = 0, 

lorsque F(w) est une non-linéarité d’ordre 
assez élevé pour introduire un terme négli- 
geable pour u petit. Des problèmes de ce 
type interviennent par exemple en théorie 
de la diffusion non linéaire. Plutôt que de 
développer un tel point de vue, nous allons 
décrire des problèmes où la non-linéarité 
joue un rôle dominant. Dans ces exemples, 
nous dégagerons deux idées. La première 
idée est que les solutions sont en général 
peu régulières et donc que les solutions ne 
pourront avoir un sens qu’en utilisant la 
théorie des distributions. Encore plus que 
dans le cadre linéaire, cette théorie 
s’impose dans le cadre non linéaire. Cette 
situation introduit une difficulté supplé- 
mentaire pour la construction de solutions 
ou le passage à la limite dans les méthodes 
approchées. En effet, comme il s’agit d’un 
problème non linéaire, on sera conduit à 
étudier la limite d’expressions de la forme 
F(w„), où F est non linéaire. En général, il 
sera facile de prouver que ( u n ) converge 
vers une fonction u et F(w„) vers une 
fonction G (au sens des distributions), 
mais il sera difficile de prouver que 
F(w) — G. Par exemple, pour n tendant 
vers l’infini, la fonction u n (x) = sin nx 
converge vers 0 au sens des distributions, 
tandis que la fonction : 

F (u n (x)) = ( u n (x)y 

= sin 2 nx = ^ (1 — cos 2nx ) 
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converge vers 1/2, toujours au sens des 
distributions. 

Bien entendu, cette pathologie s’expli- 
que par le fait que, pour n tendant vers 
l’infini, la fonction sin nx oscille de plus en 
plus vite. On sera donc amené à montrer 
que, dans un sens convenable, les oscilla- 
tions des solutions approchées ne sont pas 
trop grandes ; mais, justement, ce point est 
en contradiction avec l’existence de solu- 
tions singulières, et une analyse très fine est 
alors nécessaire. 

La seconde idée est de faire appel, 
beaucoup plus que dans le cas linéaire, à la 
comparaison avec les équations différen- 
tielles ordinaires. Par exemple, on peut 
montrer qu’une onde de choc se forme en 
comparant la dérivée de la vitesse à la 
solution de l’équation différentielle ordi- 
naire : 


y' — y 2 > 

donnée par y (/) — 1/(1 — 0 ; o)> qui devient 
infinie en un temps fini. De tels phénomè- 
nes apparaissent aussi dans la description 
de la focalisation de rayons lasers. On peut 
montrer de plus que, pour des temps 
grands, les solutions de certaines équations 
(Navier-Stokes par exemple) restent pro- 
ches de problèmes en dimension finie. 
Inversement, des problèmes non linéaires 
à très peu de degrés de liberté peuvent 
exhiber beaucoup de pathologie. 

Ainsi, il n’existe pas de théorie générale 
du non-linéaire et cet article est une 
collection d’exemples significatifs. La 
non-linéarité intervient dans beaucoup 
d’autres problèmes, en particulier dans les 
équations elliptiques qui décrivent les 
surfaces minimales, dans les équations de 
Monge-Ampère et dans les équations de 
Yang-Mills de la théorie quantique des 
champs. 


1 . Les systèmes hyperboliques 
non linéaires 


On se propose de considérer des systèmes 
de la forme : 


( 1 ) 




o, 


où u est un vecteur à m composantes et F / 
une fonction régulière de R" T dans R"'. Son 
gradient (par rapport à u) est donc une 
matrice A /(«), et on dira que le système ( 1 ) 
est non linéaire hyperbolique si les A, sont 
des fonctions non linéaires de u et si les 
valeurs propres de la matrice : 


i = 1 

sont toutes réelles pour tout vecteur 

£ = (£i. £2» £,„) ^ R '"- 

De tels systèmes se rencontrent dans de 
nombreux domaines de la physique (méca- 
nique des fluides, magnétohydrodyna- 
mique, combustion, etc.). Ils correspon- 
dent à des problèmes physiques célèbres, 
comme le calcul de la traînée et de la 
portance d’une aile d’avion, ou la propa- 
gation d’une onde de choc. 

Pour comprendre la difficulté du pro- 
blème, on peut considérer un modèle 
« abstrait » qui décrit la distribution des 
vitesses d’un fluide monodimensionnel 
sans force extérieure. Le mouvement des 
particules est donné par l’équation diffé- 
rentielle ordinaire : 


(2) x (t) = u(x(t),t), 

et la relation fondamentale de la mécani- 
que conduit à écrire : 


( 3 ) 


0 -*<'>=£+g*<o 


_ du du _du d f \ 

dt dx U ôt dx V 2 / 
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L’équation ainsi obtenue est dite équa- 
tion de Burger. On déduit de (3) que l’on 
a : 

^«(*( 0,0 = 0 , 

et donc que u est constant le long des 
solutions de (2), ce qui implique ensuite 
que les courbes définies par (2) sont en fait 
des droites. Cela permet de construire la 
solution de l’équation de Burger : 

...du d ( u 2 \ 

(4) â7 + ^ly) =0> “(*>°) = ?(*>> 


pour une donnée initiale régulière cp, et 
pendant un temps petit, en inversant 
l'équation : 


X = *<p(ÊJ + 

et posant u(x, t) = cp(Ç -v ). Un tel procédé 
n’est possible que tant que l’équation (4) 
est résoluble. Or, l’équation (4) cesse d’être 
résoluble dès que deux droites caractéris- 
tiques se rencontrent, ce qui correspond à 
un choc entre les molécules de fluides et 
empêche que la solution reste continue. 
On est donc conduit à chercher une 
solution discontinue de (3) après le choc, 
c’est-à-dire une fonction «-mesurable et 
bornée qui vérifie (4) au sens des distribu- 
tions. En particulier, si elle est discontinue 
le long d’une courbe x = s(t), dite courbe 
de choc, elle devra vérifier la relation de 
saut : 


*'(0 = ^(« + + «-). 

où u + et u~ désignent les vitesses du fluide 
avant et après le choc. Une telle relation, 
qui est contenue dans la formulation (4), 
au sens des distributions, est dite relation 
de Rankine-Hugoniot. En fait, un choc 
correspond à une perte d’information et, 
sur des exemples simples, on voit que la 


relation (4) ne suffit pas à assurer l’unicité 
de la solution. Il convient d’ajouter une 
condition supplémentaire qui signifie que 
les caractéristiques rentrent dans le choc. 
Une telle condition est dite condition 
d’entropie et elle est, dans cet exemple, 
équivalente à la condition « + < u qui 
signifie que, dans un choc, la vitesse 
diminue. On est donc conduit à résoudre 
l’équation (4) dans le cadre des fonctions 
qui admettent des discontinuités et qui 
vérifient de plus la relation d entropie . La 
vérification de cette relation d’entropie 
introduit une difficulté car elle fait inter- 
venir les courbes de choc, qui sont elles- 
mêmes des inconnues du problème. Pour 
simplifier, on introduit une fonction rj(«), 
strictement convexe, quelconque et on 
note g(u) la primitive de la fonction 
H '(u ) . u ; on remarque que là où u est 
une solution régulière, elle vérifie la rela- 
tion : 

(5) + -^g(u) = 0. 


Cela cesse d’être vrai là où il y a des 
discontinuités, car la condition de saut 
pour le premier membre de (5) est en 
général différente de la relation de 
Rankine-Hugoniot. Ainsi : 


£n(«) + £*(«) 


est une distribution dont le support est 
porté par l’ensemble des points singuliers 
de u. Il est ensuite facile de voir que la 
relation u > w + est équivalente au fait 
que cette distribution est négative. Une 
solution faible entropique est donc une 
fonction qui vérifie au sens des distribu- 
tions les équation et inéquation : 


( 6 ) 


du d ( 
dt dx V 2 J 


= 0 , 


if w<o. 
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Dans le cas scalaire, on peut généraliser 
ces notions à un système à n variables 
d’espace : 


(7) 




0. 


À toute fonction r\(u), on associe alors une 
fonction G(t/) définie par : 


(8) G(«) = (gi,g 2 ,-,g B )i 

et on démontre qu’il existe une unique 
fonction u, solution au sens des distribu- 
tions dans R" X [0, oo ] du problème : 


plus facile car la présence du laplacien 
empêche la formation de chocs. Lorsque £ 
tend vers zéro, u t converge vers une 
solution de : 


du 

Tt 


+ Zé F,( " )=a 


De plus, si on multiplie par r)'(w e ), on 
obtient : 


do è n(u ' )+ Zé g/( “‘) 

= EAn(H £ ) — £n"OOlVtt e | 2 . 

Comme q"(w £ ) est positif, on en déduit 
la relation : 



u(x, 0) = <p(x), 


où cp désigne la donnée initiale, et q une 
fonction quelconque strictement convexe. 
Un des outils essentiels ici est l’utilisation 
des espaces de fonctions à variation bornée 
qui, en gros, sont des espaces de fonctions 
dont les dérivées, au sens des distributions, 
sont des mesures. Ces espaces sont assez 
vastes pour contenir des fonctions discon- 
tinues mais suffisamment réguliers pour 
satisfaire à des théorèmes de convergence 
adaptés aux problèmes non linéaires. Par 
exemple, la suite de fonctions déjà citée 
u n (x) == sin nx n’est pas uniformément à 
variation bornée. Une idée de base pour la 
construction de la solution est d’introduire 
l’équation perturbée : 

(10) 7T + Zé F,0, ‘ ) “ eA ““ 

u{x, 0) = <p(x). 

C’est une équation parabolique non 
linéaire dont la résolution est beaucoup 


^n(M £ ) + ^ ^g/(«e) < eAn(K s ). 

Il est facile de montrer que u E est borné 
et donc que : 

eAri(M E ) = A(en(« E )) 

converge vers zéro au sens des distribu- 
tions. On obtient ainsi l’inégalité d’entro- 
pie. 

Dans la plupart des problèmes physi- 
ques, u n’est pas un scalaire mais un 
vecteur, car le système est décrit par 
plusieurs paramètres ; en particulier, en 
mécanique des fluides, par la densité, les 
composantes de la vitesse et la tempéra- 
ture. On obtient donc des systèmes de la 
forme : 



Comme dans le cas scalaire, ces systè- 
mes génèrent des ondes de choc, donc il est 
indispensable de chercher des solutions 
faibles. On est amené à généraliser la 
relation de saut (cf. supra ) et la condition 
d’entropie. Pour l’entropie, une condition 
supplémentaire apparaît car q(w) est main- 
tenant une fonction de m variables réelles. 
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On peut multiplier à gauche l’équation (12) 
par le vecteur Vp(w), mais il n’existe pas en 
général de fonction g s (u) de m variables qui 
vérifie la relation : 

(13) V^(tt) = Vn(«)VF / (tf) 

= (Kj(tt) f K 2 («), K „(«)), 

car le vecteur figurant à droite de ( 1 3) n’est 
en général pas un vecteur gradient ; il faut 
(et, dans les exemples que l’on considère en 
mécanique des fluides, il suffit) que l’on ait 
les relations : 

ô K, (u ) _ ôKj{u) 

ôuj düj 

Un calcul simple montre que ces rela- 
tions sont équivalentes à la relation matri- 
cielle : 

(14) V 2 r| (« ) . V F ; (« ) = (V F ; (« ))* . V 2 n(w), 

ou, ce qui revient au même, à la symé- 
trie des matrices V 2 r|(w) . VA ,(w). 11 se 
trouve que la plupart des systèmes hyper- 
boliques possèdent une fonction r\(u) 
qui vérifie les propriétés de commuta- 
tion (14). Cette fonction coïncide, à un 
éventuel changement de signe près, avec la 
fonction d’entropie introduite en thermo- 
dynamique. Ce fait justifie a posteriori 
le nom de fonction d’entropie pour q(w) et 
de flux d’entropie pour g{u) = (g\(u), 
g„(w)). Cette notion a deux 
conséquences importantes. D’une part, 
elle conduit à caractériser les solutions des 
systèmes par les équation et inéquation 
suivantes : 

< l5 > 57+ 

satisfaites au sens des distributions . D’autre 
part, dans la phase de régularité (par 
exemple pour un temps petit), avec des 


données initiales régulières, le système (12) 
est équivalent à : 

(16) V 2 n(«)y" + = 0. 

Si on utilise ce système pour étudier des 
perturbations autour d’un état stationnaire 
constant w, on est conduit aux équations : 

(17) v*n(«)^+ ^Vn(«)F;(»)|“ =o, 

qui constituent un système symétrique 
hyperbolique. 

Ces considérations justifient l’impor- 
tance pratique des systèmes symétriques, 
dont les applications s'étendent bien 
au-delà des équations de Maxwell et de 
Dirac. 

Bien que les systèmes hyperboliques 
non linéaires aient suscité depuis long- 
temps l’intérêt des mathématiciens (par 
exemple, en 1930, Courant et Friedrichs 
étudiaient les problèmes hyperboliques 
posés par le vol supersonique), on ne 
dispose pas de théorèmes permettant de 
prouver dans un cadre assez général l’exis- 
tence et l’unicité de la solution d’un tel 
système. Pour u vecteur, le seul théorème 
actuellement disponible est relatif à une 
seule variable d’espace. Une démonstra- 
tion a été donnée par Glimm en 1966 sous 
des hypothèses assez générales ; à part un 
traitement particulier du problème de 
l’élasticité non linéaire, dû à Di Perna, elle 
n’a pas été améliorée depuis. Le modèle 
monodimensionnel est cependant très étu- 
dié car il correspond par exemple à la 
propagation d’une onde de choc dans un 
piston de moteur à explosion. 11 permet 
aussi de considérer des problèmes possé- 
dant une symétrie sphérique, comme le 
problème de l’explosion de la poudre 
autour des masses critiques d'une bombe 
atomique. 
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2. Les équations de Navier-Stokes 

Le chapitre précédent était consacré aux 
systèmes hyperboliques non linéaires, 
domaine où la différence entre le compor- 
tement des problèmes linéaires et les com- 
portements des problèmes non linéaires 
apparaît de manière très évidente. Mais 
ces systèmes présentent les inconvénients 
suivants : 

Il n’existe que des résultats partiels et la 
plupart des questions restent largement 
ouvertes. 

Les applications concernent surtout la 
mécanique des fluides compressibles. Les 
lois de conservation classiques donnent 
alors un système d’équations qu’il faut com- 
pléter par une loi d’état , par exemple 
p = RpT (pour les gaz parfaits) ; cette loi 
dépend du modèle considéré et peut être 
obtenue soit par des arguments physiques, 
soit (sans qu’aucune justification mathéma- 
tique ne soit actuellement disponible) à par- 
tir de l’équation de Boltzmann (calcul des 
coefficients de transport par la méthode de 
Chapman-Enskog). On a donc un système 
qui est toujours compliqué et particulier. 

Pour les raisons qui précèdent, l’intérêt 
s’est porté sur les équations d’Euler ou de 
Navier-Stokes, qui s’obtiennent en suppo- 
sant le fluide incompressible mais en consi- 
dérant éventuellement des termes de visco- 
sité. 

Les équations de Navier-Stokes et 
d’Euler présentent les propriétés suivan- 
tes. Elles sont (lorsque le problème est posé 
dans R 2 ou dans R 3 ) invariantes par le 
groupe des déplacements, les transforma- 
tions galiléennes : 

u (t , x) ^ u (x , x — at ) H- a, 

où a est une constante, et par les change- 
ments d’échelle : 

x^Xx, t^*X l ~ h t, u^X h u, 


où h est réel arbitraire et À > 0. D’autre 
part, on sait, dans certains cas (en parti- 
culier avant la formation des chocs), mon- 
trer que les solutions des problèmes com- 
pressibles convergent, lorsque la 
compressibilité disparaît, vers les solutions 
des équations de Navier-Stokes. Enfin, on 
dispose de théorèmes d’existence et de 
méthodes de calcul différents et plus sys- 
tématiques dans le cas des équations de 
Navier-Stokes que dans le cas des problè- 
mes de fluides compressibles. 

Les équations de Navier-Stokes mettent 
en jeu n -+- 1 inconnues dans un ouvert O 
de R" (avec n — 2 ou 3), un champ de 
vecteurs tr = («,, u 2 , u n ), et une pres- 
sion p. Elles s’écrivent sous la forme : 

(1) ^- + ÏÏ.VÏÏ=f-Vp + V AÏÏ, v > 0, 
et 

(2) V . u = 0 

(3) ÏÏ(x, f)|*i = 0 si v > 0, 

ÏÏ(x, t ) . n | da ~ 0 si v = 0 

où n * désigne la normale extérieure à la 
frontière de l’ouvert : 

(4) u(x, 0) — y 0 (x) donné. 

Le cas v = 0 correspond aux équations 
d’Euler , qui sont donc antérieures aux 
équations de Navier-Stokes, la contribu- 
tion de Navier étant d’approcher la vis- 
cosité par le terme v A w, v > 0. Ce terme, 
qui peut être très petit, est de l’ordre de 
1/R (où R est le nombre de Reynolds) : il 
permet cependant de simplifier considé- 
rablement l’analyse mathématique. 

Comme dans le chapitre 1 , w(.v, /) repré- 
sente un champ de vitesse du fluide ; ainsi, 
en supposant que u(x , t) est une fonction 
régulière, on est conduit à introduire les 
trajectoires des particules du fluide, don- 
nées par les. équations : 

(5) x (t) = u(x(t),t), x(0)=x 0 . 
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Compte tenu de (3), le champ u(x% t) est 
soit tangent au bord dQ de Q si v = 0, soit 
nul sur dQ ; ainsi, les trajectoires x(t) 
restent à l’intérieur de Ü et, pour t fixé, 
l’application de Q dans Q définie par 
l’équation (5) : 

(6) x 0 ^x(t) 


calcul explicite. En prenant la divergence 
des deux membres de (1), on obtient : 



-Vf 


i 


ij 


du , dUi 
ÔXj dxj 


— Vf — — Ap. 


est une bijection de Q sur Q. La rela- 
tion (2) est équivalente, d’après un théo- 
rème dû à Liouville, au fait que l’applica- 
tion x 0 1 — ■ ► x(t) conserve les volumes. 

L’équation de conservation de la masse 
s’écrit sous la forme : 

(7) o = + V(p«) = ^ + «Vp 

On en déduit que si la densité p(.v, /) est 
homogène et égale à 1 (pour fixer les idées) 
à l’instant zéro, elle reste constamment 
égale à 1. L’équation (1) n’est alors que 
l’équation classique de la mécanique, 
f = m y, dans laquelle le premier mem- 
bre représente l’accélération et le second 
membre l’ensemble des forces qui contri- 
buent au mouvement ; / représente les 
forces extérieures comme la gravitation, 
v Au l’action des forces de viscosité et Vp 
les forces de pression. Contrairement à ce 
qui se passe dans la théorie des gaz 
compressibles, où la pression est calculée 
à partir des autres inconnues (vitesse, 
température et densité), par une loi d’état, 
ici la pression n’est créée que par l’incom- 
pressibilité et on peut considérer Vp 
comme un multiplicateur de Lagrange lié 
à la relation Vu — 0. On peut d’ailleurs 
éliminer ce terme, soit en utilisant le 
formalisme de l’analyse fonctionnelle, soit 
celui des opérateurs pseudodiflférentiels. 
Dans le cas où Ü = R\ on peut faire un 


La dernière équation donne p par convo- 

lution avec le noyau — On obtient 

4tt | x | 

donc finalement : 


(9) -Vp 


1 

4tt 




Bien entendu, comme on l’avait indiqué, le 
second membre de (9) fait intervenir une 
intégrale singulière qui est un opérateur 
pseudodifférentiel d’ordre — 1 . Enfin, la 
condition aux limites exprime dans le cas 
v > 0 que la viscosité empêche tout mou- 
vement sur les parois et, dans le cas v = 0, 
que le fluide est tangent aux parois. 

On remarque ensuite que la condition 
V » u = 0 permet de donner une forme 
faible au terme d’advection. Plus précisé- 
ment, pour toute fonction (pE(£)(Q))", à 
divergence nulle, on a : 


(10) (Vp, 4>) = 0 

et : 




'ë = - ( “’ uv<p) 


ainsi, on dira qu’une fonction est solution 
faible si elle est à divergence nulle et vérifie 
au sens des distributions l’équation : 

(11) ~ («,<p) — (">« Vcp) — v(«, A(ç>) = (/; qp), 

pour toute fonction (p E ('D(Q))" à diver- 
gence nulle. 


204 


DÉRIVÉES PARTIELLES équations aux 


Pour construire une solution faible, il 
est essentiel d’obtenir des suites u e qui 
appartiennent à L 2 (0, T X Q), pour T fixé 
arbitrairement grand, et qui convergent 
presque partout pour pouvoir passer à la 
limite dans le terme u[u{. Multipliant 
l’équation ( 1 ) par u et intégrant par parties, 
on obtient (en supposant que u est une 
fonction régulière) la relation : 

(,2 > sJJ'-fcoi’* 

+ vf \Vu(x,t)\ 2 dx= [ (f,u)dx , 
Jq Jq 

cette relation (12) exprime le bilan d’éner- 
gie et, pour v positif, elle assure que 
l’expression : 

n | Vu{x, t) 1 1 dxdt 

est uniformément bornée. On introduit 
donc les espaces de type Sobolev suivants : 

H = {u G (L 2 (Ü)) 3 1 V . « — 0, w . « | aQ = 0}, 
V 0 = [u GHj(Q) | V . « = 0], 

V,= {«eH l (ü)|V. a = 0 ,m.h|*q = 0}. 

Compte tenu de la relation Vu = 0, on 
peut définir, comme une distribution, la 
valeur de u . n\ ao ; on a alors les inclusions 
V 0 C Vj C H ; l’espace V 0 est fermé dans 
V L et Vj est dense dans H. Appliquant 
l’inégalité (12), on peut prouver (ce résul- 
tat est, pour l’essentiel, dû à Leray) le 
théorème suivant : 

Théorème 1. Pour tout w 0 E H, le pro- 
blème (l)-(4) admet une solution faible au 
sens suivant : pour tout T > 0, u appartient 
à L~(0, T ; H) H L 2 (0, T ; V 0 ) et vérifie, 
pour toute fonction q} de V 0 , la relation : 

(13 )~ (“ <P) — (u,u . Vcp) + v(V«, Vcp) = <f,c p). 

Le théorème 1 est valable pour tout T 
et en toute dimension d’espace (en parti- 


culier pour n = 2, 3, qui sont les cas 
physiques). Il caractérise la solution des 
équations de Navier-Stokes par une rela- 
tion de type variationnel (comme pour les 
problèmes paraboliques) ; ainsi, les équa- 
tions de Navier-Stokes se prêtent bien à 
des calculs numériques par éléments finis. 
Par contre, il y a une différence fonda- 
mentale entre le cas n = 2 et le cas n = 3. 
En dimension 2, on peut prouver que si / 
est régulière, alors u est aussi une fonction 
régulière, ce qui assure l’unicité de la 
solution. Par contre, en dimension 3, on ne 
sait pas prouver la régularité de la solution 
pour tout temps, et donc l’unicité, sauf si 
la donnée initiale ||w 0 ||v 0 est petite par 
rapport à la viscosité et si / est égale à 0. 
Dans ce cas, on démontre, par des métho- 
des de perturbation, l’existence d’une solu- 
tion régulière pour tout temps. 

Dans le cas v = 0, on ne dispose plus de 
l’estimation sur le gradient de la solution et 
ainsi on ne peut, en dimension 3, envisager 
l’étude d’une solution faible définie pour 
tout temps. Par contre, pour t petit, on peut 
appliquer à l’équation d’Euler un théorème 
de type Cauchy-Kovalevskaïa (ce résultat 
sous sa forme primitive est dû à Lichtens- 
tein en 1930 et il a été amélioré par de 
nombreux auteurs, sans que sa nature soit 
vraiment modifiée). La limitation sur le 
temps provient du fait suivant : on établit 
des estimations a priori sur la solution (ou 
sur une solution approchée) en majorant 
une norme convenable par la solution de 
l’équation différentielle ordinaire v' — C>' 2 
qui explose en un temps fini. Par contre, en 
dimension 2, on utilise le fait que le rota- 
tionnel (qui décrit le tourbillon) s’identifie 
à un vecteur perpendiculaire au plan du 
mouvement, ce qui, dans les équations, se 
traduit par la relation : 

( 14 ) VA(«.V«) = ü.V(VAk) = m.Vü, 
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où eu désigne le rotationnel de w. La 
relation (14) implique qu’en dimension 2, 
et en l’absence de force extérieure (cette 
hypothèse n’est introduite que pour sim- 
plifier) on a la relation : 

(15) ^ + aV® = 0, 

qui exprime la conservation du tourbillon 
au cours du mouvement. La relation (15) 
permet de contrôler la norme de u(x , /) 
dans l’espace V ! dès que u 0 appartient à V, . 
On peut ainsi prouver l’existence pour tout 
temps d’une solution faible du problème 

(l)-(4) en dimension 2 avec v = 0. De 
plus, si le tourbillon est très régulier à 
l’instant t = 0, on peut montrer qu’il va 
rester régulier et établir ainsi la régularité 
et l’unicité de la solution (ce résultat non 
trivial utilise la dispersion de paire, c’est- 
à-dire l’analyse de l’évolution de la distance 
entre deux particules de fluide ; il est dû à 
Wolibner vers 1930). 

En parallèle avec les équations d’évo- 
lution, il est naturel de considérer des 
équations de Navier-Stokes station- 
naires : 

(16) — vAw + uVu =/ — V/j ; Vw = 0, 

avec les conditions aux limites u\ dü = 0 
(avec v > 0). 11 est alors facile de voir que 
le problème (16) admet toujours des solu- 
tions, et n’en admet qu’une seule si v est 
grand. 

Il reste autour des équations de Navier- 
Stokes un certain nombre de problèmes 
que nous allons commenter : 

(I) Déterminer si, en dimension 3, les 
équations d’Euler présentent, comme les 
équations des fluides compressibles, des 
singularités au bout d’un temps fini. En 
effet, on ne dispose que d’une majoration 
d’une norme convenable de la solution et 
le fait que cette majorante devienne infinie 


ne donne aucune indication sur le com- 
portement de la solution elle-même. Une 
raison fondamentale pour laquelle l’étude 
de l’apparition des singularités pour 
l’équation d’Euler est plus difficile que 
pour les équations des fluides compressi- 
bles est que les singularités ne résulteront 
pas du choc des molécules (à cause de la 
condition Vw = 0) mais de phénomènes 
beaucoup plus complexes qui, a priori, 
n’ont aucune raison d’être localisés sur des 
surfaces. 

(II) Déterminer si, en dimension 3, les 
solutions des équations de Navier-Stokes 
(avec v > 0) présentent vraiment des sin- 
gularités. Leray avait montré que si ces 
singularités existaient, elles résidaient sur 
un ensemble assez petit. Ce résultat a été 
progressivement amélioré et finalement 
Cafarelli, Kohn et Nirenberg ont montré 
que le support singulier de la solution de 
( 1 )-(4) est, pour tout v > 0, contenu dans 
un ensemble de mesure de Hausdorff au 
plus égale à 1 dans l’espace à quatre 
dimensions R v 3 X R,. 

(III) Déterminer si, en dimensions 2 et 
3, les solutions des équations de Navier- 
Stokes avec v > 0 convergent vers les 
solutions des équations d’Euler lorsque la 
viscosité tend vers 0. Ce problème est 
résolu en dimension 2 si Q — R 2 et en 
dimension 3 si Q = R 3 , si on se limite à un 
temps assez petit (en relation avec l’exis- 
tence locale des solutions). Par contre, si le 
domaine présente une frontière, la condi- 
tion aux limites u| dQ = 0 crée, pour v petit, 
une couche limite (région de fort tour- 
billon). Cette couche limite a une impor- 
tance fondamentale dans les problèmes 
d’aérodynamisme (fig. 1). La non-linéarité 
du problème va entraîner une propagation 
de ces couches vers l’intérieur et donc, sur 
le plan mathématique, empêcher de 
contrôler la solution et de prouver sa 
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fig. 1 - Cette photo met en évidence les lignes de courant d'un fluide autour d'un obstacle (nombre de Reynolds 2000). 
On remarque à ta fois l'apparition de la couche limite et fa propagation des tourbillons loin derrière l'obstacle (O.N.É.R.A). 

convergence vers une solution de l’équa- que l'ensemble des solutions de (18) appar- 
tion d’Euler. tient en général à une variété analytique de 

(IV) Étudier la structure asymptotique, dimension finie et que les solutions de (1 7) 

lorsque le temps augmente indéfiniment, résident aussi arbitrairement près d une 

des solutions de l’équation : variété analytique de dimension finie. On 

peut en conclure que l’étude asymptotique 
(17) ~vA k + w . Vw =/— V/>, Vm = 0 des solutions de Navier-Stokes peut se 

déduire de l’étude des solutions des systè- 
en relation avec les solutions de l’équation mes différentiels ordinaires ; en particulier, 
stationnaire : on peut donner des conditions suffisantes 

/10 x . _ . ^ _ sur v et / pour que la variation de v 

engendre une bifurcation de Hopf. 

Pour étudier les problèmes (17) et (18) Les problèmes mathématiques concer- 
dans un domaine borné O, avec la condi- nant les équations de Navier-Stokes sont 

don aux limites u\ ôü = 0, on utilise les reliés à différentes interprétations de la 

propriétés de l’opérateur — vA, en parti- notion de turbulence. Lorsqu’on augmente 

culier le fait que sa résolvante est aussi expérimentalement le nombre de Reynolds 

compacte ; on peut ainsi montrer (Temam) d’un fluide (par exemple en augmentant les 
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forces extérieures ou la vitesse des parois du 
récipient du fluide, ce qui par un change- 
ment d’inconnues se ramène à un problème 
de même nature), on voit le fluide passer 
d’un état régulier à un état turbulent. 

L’état turbulent se caractérise par les 
propriétés suivantes. 

Il apparaît des structures très complexes 
mais autosimilaires dans lesquelles le tour- 
billon prend des valeurs arbitrairement 
grandes. À petite échelle, ces structures 
sont homogènes, mais plus la taille du tour- 
billon augmente, plus les régions où celui-ci 
est grand sont petites. On dit que l’on a un 
phénomène d ’ intermittence (fig.l). 

Compte tenu de leur universalité, les 
équations de Navier-Stokes devraient 
contenir dans leurs solutions tous les 
phénomènes de turbulence, en liaison avec 
les pathologies (I) à (IV). Voici des expli- 
cations possibles de la turbulence : 

a) l’apparition de singularités au bout 
d’un temps fini pour les équations d’Euler 
en dimension 3 ; 

b) comportement « turbulent » lorsque la 
viscosité tend vers 0 ; 

c) une cascade de bifurcations dans les 
solutions de (18) qualitativement sembla- 
bles aux bifurcations en dimension finie. 

Il est conjecturé que ces trois phénomè- 
nes doivent avoir en commun un certain 
nombre de propriétés fondamentales, dont 
le fait de se produire sur des ensembles de 
dimension fractionnaire qui ressemblent à 
des ensembles de Cantor. En particulier, le 
problème (18) devrait exhiber, pour une 
valeur de v assez grande, un « attracteur 
étrange ». Signalons, d’une part, que des 
bornes supérieures pour la mesure de Haus- 
dorff de ces éventuels attracteurs ont été 
obtenues par plusieurs auteurs (Douady et 
Osterlé, en 1980) et que, d’autre part, il est 
possible de construire des modèles simples 
qui présentent un comportement asympto- 


tique turbulent. Un des meilleurs candidats 
pour cette démarche est le système de 
Lorenz. Il est obtenu à partir du problème 
de Bénard : on considère un fluide incom- 
pressible dans un récipient bidimensionnel 
chauffé par en dessous ; les équations (17) 
et (18) sont alors couplées avec une équa- 
tion pour la température et / se réduit aux 
forces de gravité. Lorenz développe alors u 
et /en série de Fourier et, ne conservant que 
trois des premiers coefficients, obtient le 
système : 


(19) 


X — —x + y 

y — rx — y — xz. 
z — xy — bz 


Bien entendu, il n’y a aucune justifica- 
tion mathématique dans cette démarche, 
mais il est frappant de constater les simi- 
litudes entre les comportements asympto- 
tiques des solutions de (19) et ceux, obser- 
vés expérimentalement, du problème de 
Bénard (fig. 2). 


3. L'équation de Korteweg et de 
Vries 


En 1865, Scott Russell observa sur un 
canal rectiligne une onde de surface créée 
par le choc de deux péniches, qu'il appela 
onde solitaire ; il fut frappé par la stabilité 
du phénomène et raconte qu’il put la suivre 
à cheval, à vitesse constante, pendant 
plusieurs kilomètres. 

Pour expliquer ce phénomène, dit de 
soliton , on peut utiliser un système de deux 
équations à une dimension d’espace : 


( 1 ) 

( 2 ) 


dh d , , x . 

Tt + T x (uh) = 0 ' 


du 

dt 


+ tiu x + gh x = 0, 


dans lesquelles h désigne la hauteur de 
l’eau et u la vitesse du fluide, dans un canal 
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fig. 2 - Expérience de Bénard : fumée de cigarette entre deux cylindres en rotation (O.N.É.R.A.). 


supposé indéfiniment long et peu profond ; 
g est une constante qui représente la 
gravité. Le système (1), (2) est un système 
hyperbolique non linéaire, du type évoqué 
dans le chapitre 2, et il s’obtient en écrivant 
les équations classiques des fluides incom- 
pressibles et en introduisant un paramètre 
petit lié à la profondeur du canal. 

En effectuant un nouveau développe- 
ment asymptotique, lié à l’amplitude de 
l’onde, Korteweg et de Vries obtinrent en 
1895 l’équation : 


ôh , dh 0 d'h n 
— +a/r r + p— - = 0, 
ôt dx dx ' 


où a et (3 désignent des constantes. Par un 
changement de variables et d’inconnues, 
on peut écrire l’équation sous la forme : 

du , du d'u 
(3) Jt~ 6u dx + dx~ 3=:0 ' 

Korteweg et de Vries observèrent que 
cette équation admet des solutions « ondes 
solitaires » de la forme : 


(4) = 


- et ))“*, c > 0 ; 


ce sont des ondes qui se propagent avec la 
vitesse c sans se déformer. Cette situation 
est fondamentalement différente de celle 
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qui peut se produire dans un modèle 
linéaire. Les équations linéaires dont les 
solutions se propagent sont les équations 
hyperboliques ; les vitesses de propagation 
sont imposées par l’équation, et la forme 
de la solution qui se propage est indépen- 
dante de la vitesse. Dans cet exemple non 
linéaire, on peut avoir des ondes qui se 
propagent avec n’importe quelle vitesse 
positive, mais leur forme est imposée par 
la vitesse selon la formule (4). En particu- 
lier, plus la vitesse est grande, plus la 
solution est grande. 

Intuitivement, on peut expliquer cette 
conservation de la forme par la compéti- 
tion de deux phénomènes, en disant que 
l’équation (3) est un « mélange » des 
équations : 


(5) 

( 6 ) 


du d 3 u 

— + = 0 , 

dt dx 3 

du du 

6 u — = 0 

dt dx 


En multipliant (5) par u et en intégrant 
de — oc à + oo, on observe que l’expres- 
sion : 


reste constante, autrement dit la solution ne 
tend pas vers 0 dans l’espace L 2 (R) ; mais 
on remarque, en utilisant par exemple la 
transformation de Fourier, que, pour x fixé 
(et pour une donnée initiale assez régu- 
lière), u(x , t) tend vers 0 comme î 3(/2 pour 
t tendant vers l’infini. L’équation (5) décrit 
une onde qui se disperse, tandis que l’équa- 
tion (6) est l’équation de Burger, étudiée au 
chapitre 1, qui engendre un choc. 

En fait, l’équation de Korteweg- 
de Vries possède des solitons car les 
phénomènes de création de chocs et de 
dispersion se compensent pour arriver à un 
état d’équilibre. En 1965, Kruskal, Miura 


et Zabusky remarquèrent une analogie 
entre le système (1) et le modèle de 
Fermi-Pasta-Ulam. Ce modèle avait été 
introduit en 1950 pour décrire la réparti- 
tion de l’énergie sur un cristal non conduc- 
teur ; il était composé de 32 équations 
différentielles ordinaires non linéaires 
couplées et a été calculé par approxi- 
mation numérique sur l’ordinateur Maniac 
I de Los Angeles. Les auteurs observèrent, 
au lieu d’une répartition uniforme de 
fénergie sur tout le cristal, des phéno- 
mènes de périodicité ou de presque pério- 
dicité. Ces phénomènes furent expliqués 
beaucoup plus tard par Arnold, Moser 
et Kolmogorov dans le cadre de la théo- 
rie des systèmes hamiltoniens. Kruskal 
et d’autres entreprirent alors de discré- 
tiser l’équation de Korteweg - de Vries et 
découvrirent deux types de phénomènes. 

a) Dans le cas où on considère des don- 
nées initiales cp(x) périodiques en espace, la 
solution reste périodique en espace mais 
est une fonction presque périodique en 
temps. 

b) Dans le cas où la donnée initiale cp(xr) 
est une fonction tendant vers 0 pour 
| x | co et si elle est « composée » 
d’une somme finie d’ondes solitaires, 
ordonnée suivant la taille (les plus petites 
d’abord), alors les plus grandes ondes 
rattrapent les plus petites et, au bout d’un 
certain laps de temps, on obtient à nouveau 
une solution soliton, avec la différence que, 
maintenant, ce sont les plus grandes qui 
sont en avant : l’ordre s’est inversé. 

La démonstration de ce type d’obser- 
vation a pu être entreprise d’après une idée 
de Lax (1968). Il introduit un opérateur 
auxiliaire défini par la relation : 

H(t) = — D 2 ip + u(x, T) 4 J. 

où D désigne ici la dérivation par rapport 
à x 
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L’opérateur H(?) dépend du paramètre 
t par l’intermédiaire de la fonction u. C’est 
l’opérateur autoadjoint (dans l’espace de 
Hilbert L 2 (R)) usuel de la mécanique 
quantique. On cherche alors des condi- 
tions suffisantes pour que H (f) reste uni- 
tairement équivalent à lui-même, ce qui 
signifie qu’il existe une famille U(/) d’opé- 
rateurs linéaires unitaires de L 2 (R) sur 
lui-même tels que l’on ait : 

H(0 = U(OH(0)tM(/) = U(OH(0)U*(0- 

Cela se produit, par exemple, si u(x, t) est 
déformé par translation : 

(7) iiC*,0 = <p(*—0. 


On remarque alors que u(x, t) est solu- 
tion de l’équation : 


( 8 ) 


du du 
dî dx 


= 0 . 


L’équation (10) s’écrit aussi sous la 
forme particulièrement commode : 

(11) ^ = L(r)H(0-H(?)L(0 = [L,H]. 

Comme H(/) est l’opérateur (d 2 / 
dx 2 ) + u( x, /), (dH)l(dt) est l’opérateur de 
multiplication par (du)/(dt). 

Comme exemple d’opérateur moins 
trivial que d/(dx), on peut introduire l’opé- 
rateur : 


L(0 = 


d 3 d. 
dx 3 + dx 




L(0 est un opérateur antiadjoint dans 
L 2 (R) ; pour que le second membre de ( 1 1 ) 
soit un opérateur de multiplication sca- 
laire, il faut et il suffit que b figurant dans 
la définition de L(/) et u figurant dans la 
définition de H(/) soient reliés par la 
relation b — — (3/4) u . On a alors : 


Plus généralement, soit L(/) une famille 
d’opérateurs antiadjoints dans L 2 (R), 
dépendant assez régulièrement du para- 
mètre î (en particulier, leur domaine en 
tant qu’opérateur antiadjoint est indépen- 
dant de t ), alors l’équation : 

(9) = L(0 <p, <p(0) = qp 0 



et la relation (11) est alors équivalente à 
l’équation de Korteweg - de Vries. On a 
donc démontré le théorème suivant, dû à 
Lax : Pour que l’opérateur : 

d 2 / X 


admet une unique solution donnée par 
cp(0 = U(/)(po, où U est un opérateur 
unitaire. Dans le cas des équations (7) et 
(8), L(/) est l’opérateur — d/dx et U(0 est 
le groupe des translations. Avec ce forma- 
lisme, on remarque par un calcul très 
simple que la relation : 

U*(/)H(0U(0 = H(0) 
est équivalente à la relation 

(10) 0 = ^(U*(r)H(OU(/)) 

= U*(<)(-L(OH(0 + H'(0 + H(l)L(r))U(r). 


soit unitairement équivalent à l’opérateur : 


d 2 

'dx 2 


4- u(x, 0) 


par l’intermédiaire des opérateurs unitai- 
res définis par 


wx ê 3 3, d d , 

L (t ) — - — - + — (m - — h t— u ), 
dx 3 4 dx dx 


il faut et il suffit que la fonction u soit 
solution de l’équation de Korteweg - de 
Vries. Le progrès accompli est dû en 
particulier au fait que, pour | x \ — * oo, h(t) 
est unitairement équivalent à d*f(dx 3 ). 
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D’autre part, on peut analyser les fonc- 
tions solutions de l’équation : 

(12) — ^| + «cp = X(p 

ou, ce qui revient au même, faire l’analyse 
spectrale de l’opérateur : 


On trouve deux types d’objets. Pour X < 0, 
il existe une suite de nombres À j < À 2 < ... 
< À„ < 0 pour lesquels (12) admet une 
solution cp non identiquement nulle et de 
carré sommable. Ces nombres correspon- 
dent aux valeurs propres ou aux états liés 
du système. Bien entendu, si H(/) reste 
unitairement équivalent à H(0), ces nom- 
bres sont constants. Les vecteurs propres 
correspondants (ç k se comportent asymp- 
totiquement, pour | x | — ► oo, comme : 

C*±exp(— \ k \x\). 

On choisit C + tel que y k soit un vecteur 
de norme 1 dans L 2 (R). Cette construction 
a engendré une famille de couples 
(k k , C A + (/)). Ensuite, on remarque que, 
pour À = t 2 , on peut, pour tout /, cons- 
truire une solution oscillante (p- de (12) 
dont le comportement asymptotique est 
donné par : 


(e-« + R(C)e ù 

1 m)e-‘ 


Les lettres R et T réfèrent aux mots 
réflexion et transmission en liaison avec 
l’interprétation physique de cette construc- 
tion. 

On procède donc de la manière sui- 
vante : à tout opérateur de la forme 
— D 2 4* w(x, t), on associe les éléments 
(X*. Q+W), om R(Ç, /)), 5 SR. Cet 
ensemble s’appelle les données de scatte- 
ring. On utilise alors un théorème de 


Gelfand-Levitan-Marchenko qui permet 
de déterminer le potentiel w(x, /) à partir 
des données de scattering par une équation 
intégrale assez explicite. Le progrès effec- 
tué est le suivant. Comme, pour | jc | — ► cx>, 
L(/ ) se réduit à D\ le calcul du compor- 
tement asymptotique des solutions de (12) 
peut être fait explicitement en fonction des 
données de scattering à l’instant zéro ; on 
détermine les données de scattering à 
l’instant t par les relations : 

’ MD = x*(0), 

C*(0 = C*(0) exp [4 
y T(U) = T(L0), 

R(U) = R(£, 0) exp (8 i&). 

On obtient ensuite le potentiel u(x , 0 à 
l’instant t. L’ensemble de ce programme 
s’appelle la méthode inverse, et il fournit les 
outils qui permettent de démontrer les 
résultats observés numériquement par 
Kruskal, Miura et Zabusky dans le cas de 
données initiales tendant vers zéro à l’infini. 

Dans le cas de problèmes périodiques, 
la situation est beaucoup plus compliquée, 
mais, en 1976, McKean et Trublowitz ont 
démontré que toutes les solutions u( y, /) de 
l’équation de Korteweg - de Vries périodi- 
ques en espace étaient des fonctions quasi 
périodiques par rapport au temps, ce qui 
confirme les expériences numériques de 
Kruskal et d’autres. Tout autant que les 
résultats, l’esprit de ces démonstrations et 
les analogies qu’ils suggèrent sont fonda- 
mentales. 

On remarque que les solutions du 
système peuvent s’écrire, en prenant les 
logarithmes des solutions des équations, 
sous la forme : 

(X*(0),lnC*(0) + M), 

(T(£, 0), In |R(Ê, 0)| + 7(00- 

Ce sont des fonctions linéaires de t ; on 
dit que l’on a globalement intégré l’équa- 
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tion de Korteweg - de Vries. Cette situa- 
tion est formellement identique au théo- 
rème de Liouville, dont nous rappelons 
l’énoncé. On considère dans R 2 ", ensemble 
des couples (/?, q), un système hamilto- 
nien : 

d_p = _d_H dq = ÔU 
K J ôt dq ' dt dp' 

et on dit qu’une famile E k (p, q) de fonc- 
tions, 1 < k < m, forme un système 
linéairement indépendant en involution si 
les deux conditions suivantes sont satisfai- 
tes : 

- l’application tangente : 

E,,E 2f 

de R 2 ” dans R m est de rang m ; 

- pour tout couple k , / d’indices, on a la 
relation suivante : 


(15) 


Z (àB à dE [ _dE i dE È \ Q 
V dpi dq f dpi dpi ) 


On a alors le résultat suivant : tout 
système hamiltonien admettant n intégra- 
les premières en involution et linéairement 
indépendantes est complètement intégra- 
bles. 

Comme dans l’énoncé du théorème de 
Liouville, on dispose d’une infinité de 
fonctionnelles invariantes pour l’équation 
de Korteweg - de Vries, dont les premiè- 
res : 


h{u) = J + u(x,t)dx, 

'i(«) = \ “ 2( *’ ‘ > dx ' 

I 2 (« ) = (u 3 (x,t) +^u 2 x (x,t)) dx, 

!:>(*) = + 2 uu\ + ^(u„) 2 )rfx, 

avaient été déterminées par Kruskal et ses 
collaborateurs avant l’introduction de la 
méthode inverse. 


D’autre part, l’équation de Korteweg - 
de Vries est équivalente à l’équation : 



où ÔI 2 /Ôw désigne la dérivée au sens de 
Gateaux de la fonctionnelle I 2 (n), dérivée 
qui s’obtient par des méthodes standards 
de calcul des variations. On peut ensuite 
munir l’espace H 1 (R) d’une structure 
algébrique qui généralise la notion 
d’espace symplectique. Pour cette struc- 
ture, (16) est une équation hamiltonienne 
et les fonctionnelles I„ sont en involution. 
Ainsi, l’équation de Korteweg - de Vries 
fournit un exemple qui satisfait à la fois 
aux hypothèses et aux conclusions du 
théorème de Liouville en dimension 
infinie. Un tel théorème n’est pas encore 
démontré (la difficulté essentielle étant 
de caractériser le fait que l’ensemble 
des fonctionnelles invariantes est assez 
gros). 

La détermination successive des 
invariants de l’équation de Korteweg - de 
Vries a conduit à lui associer une structure 
algébrique très complexe qui est reliée à 
la géométrie algébrique (algèbres de 
Kac-Moodie), néanmoins, il est facile de 
montrer comment faire intervenir des 
variétés algébriques et des fonctions ana- 
lytiques dans la théorie de Korteweg - de 
Vries. On remarque pour cela que la 
fonction : 


, , —c/2 

u(x,t) = » 

ch 2 -c(x — et) 

définie pour x réel, se prolonge en une 
fonction méromorphe dans le plan com- 
plexe. Cette remarque, jointe à la perspec- 
tive d’utiliser le théorème de Liouville en 
dimension finie, conduit à chercher des 
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solutions rationnelles de l’équation de 
Korteweg - de Vries de la forme : 


u (* , t ) — 2 


n(0 


j(x—Xj(t )) 2 


En reportant le second membre de cette 
équation dans l’équation de Korteweg - de 
Vries écrite sous la forme : 


(17) U t — 3 UU X + \ U xxx = °> 

on trouve que, pour que u soit solution de 
( 1 7), il faut et il suffit que rfj) soit identique 
à 1 et que les xp) vérifient le système 
différentiel ordinaire : 


(18) xj f = 6 ^ {xj — x k )~ 2 , l < ; < N, 

k*j 

avec la condition : 


(19) ^(x ; — x k )~ ! = 0, 1 < ; < N. 

En s’inspirant des résultats de Lax, 
Kruskal, Garner et Als, on montre alors 
que la solution de (18) coïncide avec la 
solution du système hamiltonien défini 
par : 

(20Ï ^ = dy = dH. 

K } dt dy' dt dx’ 

Il n’est pas évident que le système (18), 
(19) ait une solution; la difficulté réside 
dans la relation (19). En effet, il faut 
vérifier que si cette relation est vérifiée 
pour t — 0, elle est aussi vérifiée lorsque 
x(t ) varie avec t. On montre que cela 
impose aux x t d’appartenir au plan com- 
plexe et à N d’être de la forme 
N = (n(n 1 ))/2, pour n entier. Comme 
dans le cas continu, on met alors en 


évidence N intégrales premières en invo- 
lution et on conclut que l’on obtient un 
système hamiltonien totalement intégrable 
sur la variété complexe définie par : 

^ 3 = 0 , i « y < n. 

k*j 

Pour vérifier que : 

n ^ 

2 S(*— xj(t)Y 

j= i 

est solution de l’équation de Korteweg - de 
Vries (18), on utilise essentiellement la 
formule d’addition : 

<ï>(x) <t>'0) + <Ê(x) <Ê(y) = $(jc — y) 

[*'(*) + V(y )] — (x —y) [*(y) — *(*)], 

valable pour la fonction : 

*(*) = *- 2 , 

mais aussi pour toute fonction elliptique. 

C’est pourquoi on peut reprendre la 
théorie en cherchant des solutions de 
l’équation de Korteweg - de Vries sous la 
forme : 

N 

»(*.»)= ^ p (h* — •*■'(')))’ 

i = i 

où p est une fonction elliptique quelcon- 
que. 

Les relations (18) et (19) donnent ici : 

(21) Xj = 3 y •**))> 

(22) ^P'(^(x ; —xd) = 0, l<y<N. 

k*j 

Le première difficulté est l’étude de 
rinvariance de la relation (22) sous l’action 
du système différentiel défini par (21). 11 
n’existe pas de résultats généraux et une 
telle variété invariante peut souvent être 
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vide. Dans le cas de la fonction elliptique 
définie par : 

(p')2 = 4p 3 — g 2 p — g 3> 

on sait, pour N — 3, analyser complète- 
ment la variété invariante définie par (21) 
et (22). 

L’étude de cet exemple peut paraître 
très particulière en raison de l’intégrabilité 
complète de l’équation de Korteweg - de 
Vries et de tous les calculs exacts qui ont 
pu être menés à bien. Pourtant, cet exem- 
ple est fondamental car une partie, et 
parfois la totalité, des méthodes décrites ici 
s’appliquant à d’autres équations qui inter- 
viennent aussi bien en physique qu’en 
mathématiques « pures ». Sans les explici- 
ter, on peut citer les suivantes : l’équation 
de Korteweg - de Vries modifiée intervient 
dans l’étude des ondes d’Alfvén et des 
plasmas froids, l’équation de Schrôdinger 
non linéaire dans l’étude de la focalisation 
des faisceaux laser, l’équation de Sine- 
Gordon dans les ondes de spin et l’optique 
non linéaire, l’équation de Boussinesq en 
hydrodynamique et en théorie des plas- 
mas. L’équation de Kandomstev et 
Petviaschvili (qui est l’exemple principal 
pour lequel la théorie s’étend à plus d’une 
variable d’espace) intervient dans la des- 
cription des milieux faiblement dispersifs. 

4. Les équations de 

réaction-diffusion 

On a vu au chapitre 2 que l’étude du 
comportement asymptotique des solutions 
de l’équation dç Navier-Stokes était encore 
très fragmentaire. En particulier, il n’est 
pas possible de démontrer pour les équa- 
tions de Navier-Stokes des résultats quali- 
tatifs aussi précis que ceux que l’on observe 
sur des modèles à un nombre fini de degrés 


de liberté comme le système de Lorenz. Par 
contre, pour les équations de type 
Korteweg - de Vries, la méthode inverse a 
fourni une description complète du com- 
portement asymptotique. Ce chapitre est 
consacré aux équations de réaction- 
diffusion pour lesquelles le comportement 
asymptotique est encore le problème essen- 
tiel. Pour ce type d’équation, on ne dispose 
pas de méthode inverse. On n’aura, en 
général, qu’un nombre fini d’ondes solitai- 
res ; mais le rapport de parenté avec les 
équations différentielles ordinaires est bien 
plus importante et on peut obtenir, dans 
certains cas, des démonstrations complè- 
tes ; on s’appuie en particulier sur la théorie 
des systèmes dynamiques. 

Les équations (ou systèmes) de 
réaction-diffusion s’écrivent sous la forme : 

(1) J = D( U )A« + F(«), 

où u(x , t ) est une fonction vectorielle à 
valeurs dans R" 7 définie pour la variable .v 
parcourant un ouvert Q de R". Lorsque Q 
est différent de R", on suppose que u(x, t ) 
vérifie sur le bord des conditions aux 
limites classiques. Dans cette équation, F 
est une fonction non linéaire régulière 
définie dans R /f et à valeurs dans R" ; A 
désigne le laplacien usuel et D(w) est une 
matrice symétrique positive ou définie 
positive. Lorsque D est définie positive, le 
problème est non linéaire et parabolique, 
lorsque D n’est pas définie positive, on est 
en présence d’un problème parabolique 
dégénéré. Dans tous les cas, des méthodes 
de perturbation permettent de prouver 
que, pour toute donnée u 0 (x) définie à 
l’instant t — 0, il existe au moins, pour t 
petit et positif, une solution du sytème ( 1 ) 
qui vérifie u(x, 0) = w 0 (x). 

Ces équations interviennent dans la 
description de phénomènes non linéaires 
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dans lesquels la dépendance en espace 
introduit une évolution de type mouve- 
ment brownien. On les rencontre dans la 
modélisation des réactions chimiques, et, 
en particulier, dans les phénomènes de 
combustion, lorsque la vitesse de propa- 
gation de la flamme est assez lente par 
rapport à la cinétique chimique, contrai- 
rement au régime de détonation qui, lui, 
relève des systèmes hyperboliques décrits 
dans le chapitre 1. On les rencontre aussi 
dans l’analyse des facteurs intervenant 
dans la propagation de l’influx nerveux et 
dans la dynamique des populations. 

Les théorèmes d’existence globale, et 
certains résultats asymptotiques, reposent 
sur la notion de région invariante, que l’on 
va décrire sur un exemple simple. Suppo- 
sons, pour simplifier, que Q — R ; on 
considère des solutions u(x, t ) qui tendent 
vers des limites finies u + et u lorsque x 
tend vers plus ou moins l’infini. On 
dira qu’une région & de R'" (contenant 
et u ) est invariante si l’apparte- 
nance u Q {. y) E O pour tout x réel entraîne, 
pour t > 0 (éventuellement petit), la rela- 
tion u(x y t ) E (3. La notion de région 
invariante conduit à étudier, pour i fixé, le 
comportement des courbes .y u(x, t ) 
dans R'". C’est la généralisation aux 
équations aux dérivées partielles de l’ana- 
lyse faite, pour les équations différen- 
tielles ordinaires, à Faide du plan des 
phases. On a par exemple le théorème 
suivant : 

Supposons que D(w) est une matrice 
diagonale. Alors, tout cube : 

= n 

/ = i 

de R m à faces parallèles aux hyperplans de 
coordonnées, tel que, sur chaque face, le 
champ F soit rentrant, est une région 


invariante. En effet, si la courbe u(: y, t ) 
venait de sortir de û il y aurait une valeur 
limite (.y*, t*) pour laquelle u(x, t ) attein- 
drait la frontière de Q, par exemple sur la 
face .y, = b r Cela entraînerait que «,(.y*, t*) 
atteindrait son maximum au point (.y*, t*). 
On écrit alors la Même composante de 
l’équation (1) pour obtenir : 




Comme x*, t* est un maximum de w, 
pour .v E R et 0 </</*, on a : 

du â 2 u 

— et -r-—(x*, 0. 

vt OX 2 

Comme F rentre dans 0. et w,(x*, /*) = />,, 
on a F,(w) < 0 ; ainsi, le premier terme de 
(2) est une somme de termes positifs dont 
un au moins strictement, ce qui conduit à 
une contradiction. De plus, une analyse 
plus précise permet de montrer que : 


rn 

o = 

/ = i 

est une région invariante même si F, au lieu 
d’être strictement rentrant, est rentrant ou 
tangent. 

L’existence d’une région invariante 
compacte permet d’obtenir pour la solu- 
tion de (1) une majoration uniforme dans 
L^Q). On en déduit que, pour t < T, 
(du/dt) — Au est uniformément bornée 
dans L^Q) et donc, d’après les propriétés 
des problèmes paraboliques, très régulière. 
Il en résulte ensuite que la solution est 
définie et régulière, non seulement pour t 
petit, mais pour tout / > 0. 

On se propose dans ce qui suit de 
décrire trois exemples significatifs. 

Le premier est l’équation scalaire : 

( 3 > J7 = Jxî~ w ( a “ “X 1 — u )> 0 < a < 1. 
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L'expression explicite : 

/( w ) — — u {a — «)(1 — u) 


On supposera désormais que la fonc- 
tion F(w) vérifie la relation : 


n’est donnée que pour simplifier les 
calculs. En fait, comme on peut facilement 
le constater, seules interviennent les pro- 
priétés géométriques globales de /. Il 
convient de comparer l'équation (3) à 
l’équation différentielle ordinaire : 

§=/C«) = -«(«-#)( !-«)• 

On remarque que 0, a et 1 sont des 
points stationnaires pour l'équation (4), 
que 0 et 1 sont des points stables, tandis 
que oc est un point stationnaire instable. 
De plus, l’intervalle [0, 1] est une région 
invariante pour l'équation aux dérivées 
partielles (3) (dans ce cas, la forme 
classique du principe du maximum est 
suffisante). Cette équation a été introduite 
par Fischer en 1937 et est utilisée pour 
décrire des problèmes de génétique des 
populations ou de propagation de la 
flamme (combustion d’une mèche), il est 
naturel de chercher à décrire l'existence de 
fronts et leur stabilité, ce qui conduit à 
chercher des solutions de la forme 
w(.v, t) — u(x — et). Reportant dans l’équa- 
tion (3), on obtient l’équation différentielle 
ordinaire : 

(4) — eu = u" — u(a — w)(l — u), 

qui s'écrit comme un système en introdui- 
sant la variable v = u : 

(5) ( 

1 v — — cv + u(a — t/)(l — u) 

— — cv — F(w). 

Un front, ou onde solitaire, est alors 
une solution de (5) qui vérifie les relations : 

(6) ^ lim^ u (£) = 1, = 0, 

|t Hm J(£)"=°. 


(7) £ F (u ) du > 0, 

et on définit le point M par la relation : 


( 8 ) 


a < M < 1, 


j>> 


du = 0. 


Le point (0, 0) est un point hyperbolique 
pour le système (5) et il y a donc une solu- 
tion de (5) vérifiant lim (w(£), u(O) = 0. 


tangente à la direction hyperbolique 
répulsive. Lorsque c, augmente, v aug- 
mente jusqu’à ce que (w(£), u(£)) rencontre 
la courbe cv — — F(w). Puis v diminue ; on 
obtient alors deux possibilités. Soit (w(£), 
u(O) recoupe l’intervalle [a, 1] en un point 
M c > M, soit u(Ç)) recoupe la courbe 
cv = — F(w) en un point u > 1 ; ces deux 
circonstances dépendent du choix de c. La 
première se produit pour c petit et la 
seconde pour c grand. On montre alors 
que le point M ( . est une fonction crois- 
sante de c et qu’il existe donc une unique 
valeur c * > 0 telle que M r * = 1 ; elle cor- 
respond au front, orbite de (5), connectant 
les points hyperboliques (0,0) et (1,0) 
(fig- 3). 

De plus, il est clair que si u(x — c* t ) est 
une onde solitaire, il en est de même de 
toute solution translatée. On peut alors 
montrer, en utilisant des théorèmes de 
comparaison pour les équations paraboli- 
ques non linéaires, le résultat de stabilité 
suivant, dû à Fife et Mac Leod : Supposons 
que la donnée initiale w 0 t v) soit majorée et 
minorée par deux ondes solitaires transla- 
tées ; plus précisément, il existe A et B 
positifs, éventuellement grands, tels que 
l’on ait : 


u(x — A) < u o(x) < u(x + B) 
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fig.3 


V 



v 




pour tout a* réel. Alors, il existe un nom- 
bre D tel que u(x, t ), solution de (5), 
converge vers u(x — c*t — D) (fig. 4) . 

La situation décrite dans ce type de 
problème est donc radicalement différente 
de celle qu’on rencontre pour les équations 
de Kortweg - de Vries. 11 n’y a qu’une onde 


fig. 4 



Une solution quelconque encadrée par deux ondes 
solitaires. 


solitaire (à une translation près) et sa 
vitesse est caractéristique du problème. On 
a pu démontrer son existence et sa stabilité 
en utilisant les techniques des équations 
différentielles ordinaires et la monotonie. 

Le problème (3) est particulièrement 
simple, car il est scalaire ; cela correspond 
à des situations très simples dans lesquelles 
une seule quantité (ou le rapport de deux 
quantités) intervient. Dans le cas des 
systèmes, la situation est bien plus com- 
plexe. 

Le deuxième exemple que nous nous 
proposons d’examiner est le système de 
Fitzugh et Nagumo. Dans leurs travaux 
sur la propagation de l’influx nerveux, 
Hodgkin et Huxley observèrent les phéno- 
mènes suivants : 

a) il existe un seuil d’excitation : toute 
excitation inférieure à ce seuil ne produit 
pas de phénomène visible ; 

b) au-dessus du seuil d’excitation, on 
obtient un signal qui a une forme constante 
et se propage à vitesse constante. 

Hodgkin et Huxley ont conjecturé que 
ce comportement était dû à la diffusion et 
à l’interaction non linéaire entre un poten- 
tiel électrostatique et les réactions entre 
eux de plusieurs ions, et donc que ce 
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mécanisme était contrôlé par un système 
d’équations de réaction-diffusion. Le tra- 
vail mathématique a consisté alors à 
montrer que les solutions du système 
d’Hodgkin-Huxley avaient un comporte- 
ment conforme à l’expérience (existence 
de seuil et apparition d’ondes solitaires 
stables). Sans en démonter la validité, cela 
rend plausibles les équations de Hodgkin- 
Huxley. Ces propriétés ont été démontrées 
par C. Conley et plusieurs de ses élèves en 
utilisant une généralisation en dimension 
infinie des théorèmes de perturbation et de 
T indice de Morse utilisés dans la théorie 
des équations différentielles ordinaires. Il 
n’est bien sûr pas possible de décrire ici ces 
travaux, mais on peut donner certaines 
idées en remplaçant le système de 
Hodgkin-Huxkley par un système plus 
simple, ayant les propriétés asymptotiques 
équivalentes, dû à Fitzugh et Nagumo : 


(9) 

( 10 ) 


àv d 2 v 

T, = ë^ +f{v) - u ' 

dti 

— = e(cj v — yu). 


Comme dans l’exemple précédent / (u) 
a le comportement qualitatif de la cubi- 
que : 


f{u) = — v(v — a)(v — b ), 0 <a<b; 


les nombres a, y, et e sont des constantes 
positives et la droite a v — y u = 0 ren- 
contre la courbe u — f (v) uniquement au 
point 0. 

On observe en premier lieu l’existence 
de deux familles de régions invariantes, 
celles qui sont limitées par des grands 
rectangles R et celles qui sont limitées par 
des petits rectangles R. Sur la figure 5 
on a représenté un rectangle R et un 
rectangle R en indiquant par des flèches 
la direction du champ (f (u) — w, au —y u). 
On désigne alors par R + le plus petit 
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rectangle de la famille R et par R le plus 
grand rectangle de la famille R. Reprenant 
les théorèmes de comparaison qui ont 
conduit à la notion de région invariante, on 
démontre facilement les résultats suivants : 

- pour toute donnée initiale (u 0 (x), m 0 (.y)) 
définie sur R, continue, et tendant vers 0 
pour | x | — ► oc, le système (9), ( 1 0) admet 
une unique solution (v(x, t ), u(x, t )) défi- 
nie pour tout t > 0 : pour t assez grand, la 
courbe x | — > (u(.v, t ), w(.v, t )) est contenue 
dans le rectangle R + ; 

- de plus, si la courbe .v • - (u 0 (x), w 0 (-v)) 
est contenue dans R , la solution (vfiv, t ), 
u(x , t )) converge exponentiellement vers 0 
lorsque t tend vers l’infini. 

On a ainsi déjà mis en évidence deux 
notions : d’une part une région globale- 
ment attractante (dans le plan des phases) 
et d’autre part un bassin d’attraction de 
(0, 0) qui correspond au phénomène de 
seuil si l’excitation est trop petite : pour 
(u 0 (x),w 0 (x)) E R . pour tout xGR, la 
solution tend exponentiellement vers 0. 

On remarque ensuite que (0, 0) est un 
attracteur global pour l’équation : 

ôv du 

y t =f{v) — u, ~ = e(ov — yw); 

mais l’apparition du terme de viscosité 
d 2 v/dx 2 modifie la première équation et, 
pour u(x, t ) (pour t fixé) introduit, là où 
cette courbe est convexe, un facteur de 
répulsion qui permet à la courbe de rester 
à l’extérieur du petit rectangle (fig. 5). On 
obtient une solution rigoureuse en cher- 
chant des solutions de la forme : 

(v {x,t),u(x,t)) = (r (jc — et ), u (x — et )), 

ce qui, en introduisant la variable 
w = dv/dc,, où i = x — et , conduit au 
système différentiel ordinaire : 

(15) v = w, — eu = e{gv — yw), 

w' = — cw + u — F(m). 
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fig. 5 


u 



Régions invariantes pour les équations de Fitzugh-Nagumo. R est le grand rectangle attracteur et R (ombré) est le 
bassin d'attraction de zéro. 


On étudie alors, par des méthodes de 
perturbation, le système (15) pour e petit. 
Le choix de cette situation (e petit) se justifie 
en disant que les deux phénomènes, varia- 
tion du potentiel u, et variation de u (réac- 
tion chimique) se produisent à des échelles 
de temps très grandes l’une par rapport à 
l’autre. On peut alors, pour e petit, prouver 
l’existence d’une onde stationnaire stable. 

Le troisième exemple que nous allons 
décrire très brièvement est la réaction de 
Bielouzov-Zabotinski. En 1959, Bielouzov 
a découvert, dans l’oxydation de l’acide 
maîonique par le bromate de potassium, en 
présence d’ions cérium, des mécanismes de 
structuration spatiotemporels autoentrete- 
nus qui se présentent comme une superpo- 
sition d’ondes solitaires radiales (fig. 6). 
L’analyse des mécanismes de réaction 


conduit à écrire un système à trois incon- 
nues principales : X = HBr0 2 , Y = Br - et 
Z forme oxydée de l’ion cérium. 

On a alors le système : 

^= D ^ +a(Y - XY + x - pX2) 
( 16 ) £ = {(ïZ-Y-XY) 

g = ô(X-Z) 

où D, a, p, y, Ô désignent des constantes 
positives. Comme X, Y, Z désignent des 
concentrations de produits chimiques, il 
est naturel de décider qu’on se limite aux 
solutions du système (16) positives et 
bornées. En fait, on montre facilement que 
si a , b , c vérifient les inégalités : 
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fig. 6 - Réaction de Bielousov-Zabotinski (Society for Industrial and Applied Mathematics). 


la région : 

R = (0 ^ X < a, 0<Y ^b, 0<Z < c} 
est invariante pour le système (16). 

Le système différentiel ordinaire asso- 
cié à (16), obtenu en supprimant la visco- 
sité, a deux points stationnaires, (0, 0, 0) et 
(X 0 , ïX 0 /(l -b X 0 ), X 0 ), où X 0 est la 
solution positive d’une équation du second 
degré. Lorsque p est petit, ce point est 
instable, et on peut prouver l’existence de 
solutions homogènes en espaces et pério- 
diques en temps (ce qui correspond à des 
configurations observées expérimentale- 


ment) ; par contre, pour (3 grand, le point 
stationnaire est stable et il n’y a pas de 
solution homogène périodique en temps. 
On écrit alors le système différentiel cor- 
respondant qui a une solution onde soli- 
taire ; introduisant comme dans les exem- 
ples précédents la nouvelle variable 
N = dX/dt , , £ = x — et , on obtient un 
nouveau système différentiel qui possède 
bien la nouvelle solution stationnaire : 

(X 0 , T X 0 /(1 +X 0 ),X 0 ,0); 
par contre, ce point est instable et on peut 
prouver qu’il existe dans son voisinage une 
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solution périodique, donc une onde soli- 
taire périodique, qui, elle, sera stable pour 
le système d’évolution. On a ainsi montré 
que, pour [3 assez grand, on observe un 
phénomène périodique en espace temps. 
Voici, en conclusion, quelques remarques 
générales. 

1. Les équations de réaction-diffusion 
mettent en jeu la compétition entre des 
phénomènes non linéaires locaux et des 
phénomènes de diffusion en espace. Leur 
étude permet d’analyser l’apparition de 
solutions qui se propagent à cause de la 
diffusion, en conservant leur forme à cause 
de la non-linéarité. Cet aspect de compé- 
tition a aussi beaucoup été utilisé dans la 
dynamique des populations. On considère 
deux familles d’animaux (insectes, bacté- 
ries, etc.) vivant dans le même domaine Q. 
On en déduit un système d’équations de 
réaction-diffusion, avec région invariante, 
dans lequel le facteur de diffusion dépend, 
à un changement d’échelle près, de la taille 
de Q. Supposons que 0 est un attracteur 
stable ; on montre alors, si Q est petit, que 
la solution tend toujours vers 0. Les 
prédateurs mangent toutes les proies, puis, 
n’ayant plus rien à manger, disparaissent. 
Par contre, si la diffusion est grande, on 
observe un phénomène d’oscillations en 
espace et en temps, comme dans la réac- 
tion de Bielousov-Zabotinski : les proies 
réussissent à s’échapper et à se reproduire 
avant d’être à nouveau atteintes par le 
prédateur et le phénomène se réitère. 

2. La méthodologie a été de partir de 
l'analyse des équations différentielles ordi- 
naires et d’en généraliser les outils classi- 
ques : régions invariantes, principes du 
maximum, points stables, etc. Nous en 
avons donné les aspects les plus simples. 
Le développement systématique des outils 
mathématiques dans ce domaine est dû à 
Conley et Smoller, une étape essentielle 


étant la généralisation de l’indice de Morse 
en dimension infinie. 

3. Le terme de diffusion a été utilisé à 
propos de mouvements de population ou 
de densité de type brownien. Comme pour 
tous les problèmes qui introduisent des 
expressions de la forme : 


le rapport avec les probabilités est très 
étroit, et il existe aussi des analyses pro- 
babilistes de ce type de phénomènes. 
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L es équations différentielles sont appa- 
rues historiquement tout au début du 
développement de l'analyse, en général à 
l’occasion de problèmes de mécanique ou 
de géométrie. Si, dans les premières inves- 
tigations, l’on s’attachait surtout à en 
calculer les solutions au moyen de fonc- 
tions déjà connues, très vite ce point de vue 
s’affirma trop étroit ; c'est qu'en effet le 
problème fondamental de la théorie des 
équations différentielles est de déduire les 
propriétés des solutions d’une équation ou 
d’un système donné de la forme analytique 
de ceux-ci ; or, en général, les équations qui 
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résultent d’une investigation théorique en 
mathématiques ou en physique ne sont pas 
explicitement intégrables et constituent, 
bien souvent, la principale source pour la 
définition de nouvelles fonctions dont les 
propriétés peuvent être prévues par une 
analyse systématique de grandes classes 
d’équations ou de systèmes. 

On développera, dans les quelques 
rubriques qui suivent, les méthodes pro- 
pres à mettre en évidence l’existence de 
solutions sous des conditions appropriées 
et à en étudier les propriétés les plus 
fondamentales. 


x 2 = u, ..., x n = u (u ~ x \ la matrice A et le 
vecteur b étant alors définis par : 



b = (0, 0, ...,0,6) 


Existence des solutions 

Un premier résultat fondamental est 
donné par le théorème suivant : Le système 

(4) dx/dt — A(t)x, 

(5) x (0) = c, 




1 . Les sytèmes différentiels linéaires 
dans le champ réel 

On se propose d’étudier l’existence et les 
propriétés des solutions du système diffé- 
rentiel linéaire : 

(1) dXf/dt = ^ a {j (t)xj + 

j = i 

pour ij — 1, 2, /?, où les fonctions a if (t), 
bj(t ) de la variable réelle t sont à valeurs 
réelles ou complexes. Introduisant la 
matrice n X n, c’est-à-dire à n lignes et à 
n colonnes, A(r ) — (a^t )), et les vecteurs 
x = (x b * 2 , ..., x, t ), b — (b j, b 2 , b n ), on 
peut écrire au lieu de (1) : 

(2) dx/dt = A(0* + b{t). 

On notera que toute équation différen- 
tielle linéaire d’ordre n : 

(3) !/<”) + a AO «(«- 1 2 3 ) + ... + a n {t) u = b(t), 

u (J) désignant la dérivée d’ordre j de la fonc- 
tion u(t ) peut être ramenée à la forme ( 1 ) ou 
(2) au moyen de substitutions = u , 


où A(/ ) est une matrice n X n fonction 
continue de t G [0, / 0 ] et où c est un vecteur 
donné, a une solution unique x(t ) définie 
pour t G [0, / 0 ]. 

Il faut souligner qu’à l’équation (4) on 
a adjoint la condition initiale (5) ; on 
obtient ainsi un résultat d’existence et 
d’unicité. 

On notera qu’au système (4), (5) on 
peut substituer l’équation intégrale équi- 
valente : 


( 6 ) 


x(t) = c + J r A(t)x (t) d t, 


qui se prête fort bien au calcul d’approxi- 
mations successives inventé par Picard : 

X„(,0 = C + A(r)x„ _ J (t) d t, 

avec x 0 = c (cf. espaces métriques, 
chap. 7). 

On établit la convergence de la suite 
x m (t ) vers une fonction x(t ) ; on montre 
ensuite que x(t ) est solution de (4), (5) et 
qu’il y a unicité. 

Le même type d’argument permet 
d’établir le théorème suivant : Le système 

(7) dX/dt = A(t)X, 

X(0) = D, 
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où A(/) est une matrice n X n fonction 
continue de t G [0, / 0 ], et D une matrice 
n X n constante donnée, a une solution, 
matrice n X n, X(f), unique pour 
tG[ 0 , / 0 ]. 

On réservera, dans la suite, la notation 
X(t ) à cette solution quand on prend pour 
D la matrice identité I, et Ton dira que 
X(/ ) est la matrice résolvante. Le théo- 
rème de Jacobi montre que : 

det X(T ) = exp j J r (tr A ) dx J , 

OÙ : tr A — ^ a ü (t) ; 

i = 1 

ainsi la matrice X(/ ) est toujours inversible. 

Il est clair que la solution du système 
(4), (5) peut être représentée par 

x(t ) = X(/ )c. 

En prenant pour c les éléments de la 
base de l’espace vectoriel R" ou C", on 
obtient n solutions de (4), qui sont les 
vecteurs dont les composantes sont inscri- 
tes successivement dans les colonnes de 
X(/ ). Puisque det X(t ) ^ 0, les vecteurs 
sont indépendants quel que soit t. 
D’ailleurs, si Ton dispose de n solutions 
indépendantes à l’instant t = 0, elles le 
demeurent pour tout t : on dira que c’est 
un système fondamental de solutions. 
Enfin, il ne peut exister plus de n solutions 
indépendantes. 

Dans le cas de l’équation différentielle 
(3), supposée homogène ( b(t ) = 0), les n 
solutions u 2 , ..., u n sont indépendantes 
si, et seulement si, le déterminant de 
Wronski : 

/«I U 2 

det I u\ u 2 

\uin-D u (n- 1) 

est ^ 0 pour tout t. Il suffit que cela soit 
vrai pour une valeur particulière de t. 


L'équation linéaire non homogène 

L’équation linéaire non homogène est 
l’équation : 

(8) dx/dt = A(t)x + h>( 0» x(0) = c. 

Toute solution de (8) où A(/ ) et w(t ) sont 
respectivement une matrice n X n et un 
vecteur fonction continue donnée de 
t G [0, t 0 ] et c un vecteur constant peut être 
recherchée sous la forme : x = X(7 ) y\ où 
X(/ ) est la matrice résolvante de (7). 

Il est aisé de voir que (8) conduit à : 

dy/dt = X-HO w(t), y{ 0) = c, 

système qui a la solution unique : 

y (0 = c + J r X _l (t)w(t) d r, 
d’où, pour (8), la solution unique : 
x(t) = X(t)c + |x(0X->(T)w(r)c?r. 

Le cas des systèmes 
à coefficients constants 

Si A est une matrice à éléments indépen- 
dants de t, la matrice résolvante X(/ ) peut 
être représentée par la série convergente : 

(9) X(0 = I + Ai /\ ! + ... + A «f*/» ! ... 

On pourra introduire sur l’espace vec- 
toriel des matrices carrées n X n la norme 
définie par : 

Il AI = 

iJ = 1 

avec la topologie correspondante, on peut 
s’assurer que la série (9) converge unifor- 
mément par rapport à î sur tout intervalle 
fini, et satisfait (7). Par le théorème d’uni- 
cité on montre aisément que : 

X(r) X(s) = X(s)X(0 = X(f + s). 
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ce qui, avec (9), suggère la définition : 
e A * = X(t ). 

Il est connu que les puissances entières 
successives d’une matrice ne sont pas 
indépendantes ; si / (À) est le polynôme 
caractéristique /(À) = det (A — ÀI), on a 
/(A) = 0. Cela suggère que l’on peut 
donner à X(t ) une structure plus simple. 

Pour tout nombre complexe X, il existe 
un entier v, le plus petit entier > 0 tel que : 

(A — XI) V + l x = 0 => (A — ÀI) V * = 0; 

v = 0 si, et seulement si, X n’est pas valeur 
propre de la matrice A. Si X est valeur 
propre, v est au plus égale à l’ordre de 
multiplicité algébrique de X. Soit X,, X*, 

avec k < n, les valeurs propres distinctes 
de A, et soit : 


JLj — { x : (A — Xjiyjx = 0 } ; 


les sous-espaces JLj sont sans élément 
commun autre que 0 et leur somme directe 
est C n ; on introduit les opérateurs de 
projection E y par la formule E pc = x ), où 
x = x l + x 2 + ... + x h XjG JLj (décom- 
position spectrale). On établit que ces 
opérateurs permutent avec A et que : 


(10) X(r) = 



(A -hiy 


t m € k J f Ex. 


est la matrice résolvante de (7). 

Cette formule fondamentale montre 
que les éléments de la matrice X(f ) sont 
des sommes de produits d’exponentielle 
e x > f par un polynôme en t dont le degré est 
inférieur à l’indice v ; - de X ; -, donc a fortiori 
à l’ordre de multiplicité algébrique de X ; , 
On voit que les solutions de dXjdt = Aa 
convergent toutes vers 0 quand t — + oo si 
et seulement si les valeurs propres de la 
matrice A ont toutes leur partie réelle 
négative. 


Le cas des systèmes 
à coefficients périodiques. 

La théorie de Floquet 

Si X(t ) est la matrice résolvante de : 

( 11 ) dX/dt = P(i)X, 

où P(/ ) est une matrice n X n continue et 
périodique de période T par rapport à r, 
X(t + T) vérifie (1 1) et en vertu du théo- 
rème d’unicité : X(/ + T) - X(t ) X(T). 
Comme X(T) est non singulière, il existe 
une matrice constante B telle que 
X(T) = e m . La matrice Q(t ) = X(/ )e B/ 
est périodique de période T et on obtient 
la représentation : X(t ) = Q (t )c _B/ . Les 
valeurs propres de la matrice B sont les 
coefficients caractéristiques de la matrice 
périodique P(f ) ; il faut et il suffit qu’ils 
soient tous à partie réelle négative pour 
que toute solution de dx/dt = P(f ).v tende 
vers 0 quand t — ► + oo. 

Stabilité des solutions 

Revenons au cas général dxjdt = A(/ )x, 
où A(t ) est une matrice fonction continue 
de t G [0, + oo] ; il est souvent utile de 
connaître certaines propriétés asymptoti- 
ques de la solution, par exemple, de savoir 
si elles demeurent bornées ou tendent vers 
0 quand t — * + oo. Pour conduire cette 
étude on utilise en général des méthodes 
de comparaison et, à cette fin, on peut 
introduire un concept de stabilité 
du genre suivant : les solutions de 
dxjdt = A(/ )* seront dites stables par 
rapport à une propriété îf et une classe $ 
de matrices B (t ) si les solutions de 
dxjdt — (A(/ ) -b B (t ))x ont toutes les pro- 
priétés îT quel que soit B (t ) E 3C On peut 
illustrer ce concept en citant le théorème 
suivant : Si les solutions dxjdt — Ax, où A 
est une matrice constante, sont bornées ou 
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tendent vers 0 quand t — ► + oc, alors il en 
est de même des solutions de : 

(12) dx/dt = (A + B(/))jc, 
pourvu que : 

|p|B(Oll<* < +«. 

Si toutes les solutions de dxldt = Ax 
tendent vers 0 quand t — ► + oo, il en sera 
de même des solutions de (12) pourvu que 
Il B(0|| ^ k pour t assez grand, k étant un 
nombre qui ne dépend que de A. 

2. Les systèmes différentiels 

linéaires dans le champ complexe 

On peut reprendre les problèmes discutés 
précédemment en supposant que les fonc- 
tions qui interviennent dans la définition 
du système (1) ou (2) sont des fonctions 
analytiques de la variable z dans un 
domaine Q. On suppose d’abord que Q est 
un domaine simplement connexe, c’est-à- 
dire un ensemble de points du plan com- 
plexe ouvert et connexe dont le complé- 
ment par rapport au plan complexe muni 
du point à l’infini est connexe. On se 
propose de discuter le problème aux limi- 
tes : 

(13) dx / dz = A (z )x, x (z 0 ) = x 0 , 

avec z 0 GQ donné, x 0 vecteur de C” 
donné, A(z) matrice n X n dont les élé- 
ments sont fonction holomorphe de z dans 
O. 

On peut établir, en se servant de la 
méthode d’approximations successives, 
que le système (13) a une solution unique 
x(z) holomorphe dans Q. On peut aussi 
considérer le même problème pour le 
système matriciel : 

(14) dX/dz = A(z)X, X(z 0 ) = Xq, 


X 0 étant une matrice n X n donnée, et on 
parvient à une conclusion analogue, c’est- 
à-dire à l’existence d’une solution unique 
X(z) qui est une matrice n X n dont les 
éléments sont fonction holomorphe de z 
dans Q. 

Le théorème de Jacobi sous la forme : 

det X(z) = ex P [ J" ( ^ a »( z ) ) dz ] det Xo» 

et les considérations antérieures sur les 
systèmes de solutions indépendantes déve- 
loppées dans le cas de variable réelle 
demeurent valables ici. 

La structure des solutions 

dans le voisinage d'un point singulier 

Une situation nouvelle apparaît si l’on sup- 
pose que la matrice A(z) possède des sin- 
gularités ; plus précisément nous suppo- 
sons que la singularité est en z = 0 et que 
A(z) est holomorphe dans le voisinage 
0 < | z | < R ; on précisera plus loin la 
nature de cette singularité : ce peut être un 
pôle (ce qui signifie que les éléments üÿ (z) 
de A(z) ont tous au plus une singularité 
polaire en z = 0) ou une singularité essen- 
tielle (ce qui signifie que, parmi les éléments 
dÿ (z), il en est un au moins qui possède, en 
z = 0, une singularité de cette nature). 

D’après le résultat qui précède, on peut 
définir une solution de (14), X(z) matrice 
non singulière (on suppose det X 0 ^ 0), 
fonction holomorphe de z dans tout 
domaine simplement connexe où A(z) est 
holomorphe ; imaginons de choisir pour 
tel domaine un anneau de centre z = 0 
dont la frontière est constituée des arcs de 
cercle | z | = r, | z | — r\ 0 < r < r < R et 
du segment joignant ces deux cercles et 
porté par le rayon qui passe par un certain 
point z, r < |z| < r'. Tournant autour de 
la singularité z = 0 de l’angle 2 tt, sur un 
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circuit contenu dans l’anneau, partant de 
2 et y revenant, on pourra définir la 
matrice : X + (z) = X(zc 2/7r ). 

On s’assure aisément que X + (z) est 
solution locale de l’équation matricielle 
dX/dz — A(z)X, et, de là, qu’il existe une 
matrice constante non singulière U telle 
que X + (z) = X(z) U. 

Si on définit une matrice constante B 
telle e 2niE = U et si l’on pose Q(z) = 
X(z)e' B ln “, on voit que Q(ze 2in ) = Q(z), 
c’est-à-dire que Q(z) est une fonction uni- 
forme ; c’est d’ailleurs, une fonction holo- 
morphe de z dans le voisinage de z = 0, 
sauf peut-être en z = 0. On obtient alors la 
représentation fondamentale : 

X(z) = Q(z)e B1 -, 

où Q(z) est une matrice inversible fonction 
holomorphe de z dans 0 < |z| < R. En 
outre, si ..., X k sont les valeurs propres 
distinctes de B, JC,, ..., JL ki les sous- 
espaces de la décomposition spectrale, et 
E ; les projecteurs associés, on peut écrire 
la formule précédente : 


une condition nécessaire et suffisante pour 
qu’il en soit ainsi : ||X(z)|| X |zj“ doit être 
borné dans 0 < | z | < R pour une certaine 
valeur de a. Ces considérations s’appli- 
quent pour la description des solutions de 
l’équation différentielle linéaire d’ordre n : 

(16) 4* ai(z)u ^— *) + ... + a„{z)u = 0, 

où les afz) sont fonction holomorphe de z 
dans 0 < |z| < R. 

Cependant, dans ce dernier cas, on peut 
énoncer le théorème (Fuchs) : L’équation 

(16) est du type de Fuchs en z = 0 si et 
seulement si a^z) a, en z = 0, un pôle 
d’ordre j au plus, avec 1 < j < n. 

Le cas des équations différentielles 
linéaires du second ordre 

D’après ce qui précède, l’équation diffé- 
rentielle du second ordre la plus générale 
qui a en z = 0 une singularité du type de 
Fuchs peut s’écrire : 

(17) d 2 u/dz 2 + p(z)dti/dz + q(z)u = 0, 
avec : 


(15) X(z) — Q(z) 


X 



m ! 


z x /(lnz) m E ; . 


Pour achever de préciser la structure de 
X(z) dans le voisinage de z = 0, il faut 
savoir quelle est la nature du point z = 0 
pour la matrice Q(z). Or, celle-ci étant une 
fonction holomorphe uniforme dans le 
voisinage de z — 0, deux cas seuls sont 
possibles : elle est holomorphe en z = 0, 
ou bien elle a une singularité en ce point, 
qui ne peut être qu’un pôle ou une 
singularité essentielle. 

On dit que le système dX/dz = A(z)X 
est du type de Fuchs en z = 0 si la matrice 
Q(z) a au plus un pôle en ce point. Le 
critère de régularité de Birkhoff exprime 


(18) zp{z) -p 0 + p\z + ... + p n z n + ... 
z 2 q(z) ^q 0 + q x z + ... + q n z n + ..., 

les séries Xp n z'\ Xq n z n étant convergentes 
dans le disque | z | < R. On peut chercher 
formellement des solutions de (17) en 
posant ; 



a et les c„ étant des coefficients à déter- 
miner. 

Par substitution dans (17), compte tenu 
de (18), on peut établir que les coefficients 
c n sont déterminés de proche en proche de 
manière unique pourvu que a soit pris égal 
à l’une des racines de l’équation : 

(20) F(a) » «2 + Oo - l)a + q 0 = 0 
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et que F(a -j- n) ne soit jamais nul pour n 
entier > 0. 

Par conséquent, si la différence des raci- 
nes a! — a 2 de l’équation déterminante (20) 
est non nulle et non égale à un entier, on 
pourra ainsi obtenir deux développements 
du type (19) satisfaisant l’équation (17) et, 
dans tous les cas, on en aura au moins un. 

On peut établir la convergence de ces 
développements par une méthode de majo- 
rante et l’on voit qu’on aura toujours une 
solution du type (19) : 



n > 1 


avec F(oq) = 0, F(oq -j- «) ^ 0, n entier 
> 0, et, éventuellement, une autre solution 
indépendante du même type : 


« 2 ( 2 ) 


= 1 + d n z n 


si cq — a 2 n’est pas entier. Dans ce cas on 
dira que l’équation est du premier type de 
Fuchs en 2 = 0. 

Si maintenant a! — a 2 — s, entier ^ 0, 
on peut faire dans (17) le changement de 
fonction inconnue : u = w,(z)Ç(z) et cal- 
culer aisément CW, ce qui conduit aux 
résultats suivants : 

a) s non nul : 

u 2 (z ) = Aui(z) + B [gu x (z)h\z + w(z)], 

avec : ü(z) = z a ^l + h n z n ^j\ 

1 

b) s nul : 
a 2 (z) = A u t (z) 

+ b[ Wi (z)1iiz + z a 2 h n z n J , 


raisons de commodité, nous avons discuté 
de la structure des solutions dans le voisi- 
nage du point singulier z — 0 ; mais, par le 
moyen d’une translation ou de la transfor- 
mation z 1 — > 1 /z, on pourra toujours rame- 
ner à l’origine une singularité quelconque 
du plan complexe, qu’elle soit à distance 
finie ou infinie. 


Les équations différentielles 
de la physique mathématique 

Les équations différentielles linéaires du 
second ordre dont les coefficients sont 
fonction analytique de z, ayant pour seuls 
points singuliers z b z 2 , z 3 , z 4 , et l’infini, 
ceux-ci étant du type de Fuchs, avec, pour 
exposants, a 7 , en z p p 2 à l’infini 
(racines de l’équation déterminante), sont 
nécessairement du type : 


< 21 ) ë + 


( y i — «j — PA <fa 

V / , z — Zj J dz 



«ih 1 

— z j) 2 + 


A z 2 + 2 Bz + C 

4 

n (z—*)) 

i= 1 


u = 0, 


où A est tel que jli t et ju 2 son t racines 
de : 


m 2 + (a j + P;) — 3^) 

j = 1 

4 

+ ^ afîj -F A = 0, 

j= 1 

et B et C des constantes arbitraires. On 
notera la condition nécessaire : 

4 

(a j + Ç>j) + Ml + Mz = 3. 

7=i 


A et B désignant des constantes arbitraires. 

On dira alors que l’équation est du 
second type de Fuchs en z = 0. Pour des 


Il a été établi par Klein et Bocher que 
de nombreuses équations différentielles 
qui apparaissent dans certaines branches 
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de la physique mathématique sont des 
formes confluentes de l’équation spéciale 
de type (21) obtenue quand la différence 
des exposants à chaque singularité est 
égale à 1/2 (équation de Lamé générali- 
sée). En général, par confluence de deux 
singularités, on obtient encore un point 
singulier du type de Fuchs, mais cela n’est 
plus vrai quand on envisage la confluence 
de trois singularités. En bref, on peut, par 
des confluences convenables des cinq sin- 
gularités qui sont à notre disposition, 
obtenir six types d’équations qu’on peut 
classer suivant : 

a) le nombre de leurs points singuliers 
du premier type de Fuchs avec des expo- 
sants dont la différence vaut 1/2, 

b) le nombre des autres points singu- 
liers du type de Fuchs, 

c) le nombre de points singuliers qui ne 
sont pas du type de Fuchs : 


étant du type de Fuchs, avec, pour 
exposants, a, a', (3, (3', y, y', peut s’écrire 
(Riemann) : 


r i— a_q' + i — p — p f + 1 — y — Y 1 du 
[ z — a z — b z — c \dz 

aa '(a—b)(a—c) pp'(6 — a)(b — c) ' 

z — a z — b 

+ n\c— g)(c — £) ] 

Z C \ 4 

X - = 0 

(z— a)(z — b)(z — c) 

On exprime que u est une solution de 
(22) au moyen de la notation : 

( i abc 
a P y 2 “ • 

oc' P' Y 

Par exemple, l’équation hypergéométri- 
que est du type de (22) : 


(a)(b)(c) 

13 10 Lamé 

II 2 0 1 Mathieu 

III 1 2 0 Legendre 

IV 0 1 1 Bessel 

V 1 0 1 Weber-Hermite 

VI 0 0 1 Stokes 

Donnons un exemple : z t = z 2 = 0, 
a! = a 2 = a 3 = a 4 = 0, on fait tendre z 3 
et z 4 vers l’infini. On obtient l’équa- 
tion : 


z(l — z)d 2 u/dz 2 

+ [y — (a + p+ l)z] du /dz — ap u = 0, 


u = P 


0 « 1 

0 a 0 z 

— Y P y — a — P 


Dans le cas général de l’équation de 
Riemann (22), les deux transforma- 
tions suivantes qu’on peut vérifier par 
un calcul direct sont de grande impor- 
tance : 


z 2 d 2 u /dz 2 + zdu /dz + (z — n 2 )u /4 = 0, 

qui, par le changement de variable 2 ► z 2 , 
devient l’équation de Bessel : 

z 2 d 2 u/dz 2 + zdu /dz + (z 2 — n 2 )u — 0. 

De façon analogue, l’équation différen- 
tielle linéaire du second ordre la plus 
générale à coefficients qui soient des 
fonctions analytiques de z, ayant pour 
seuls points singuliers a , b , c, ceux-ci 




(7 r\ 

1 

r « 

b 

c 

L— 

1 ) x 

l-=i) 
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P 
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a 

P 

T [ 


L a' P' 

r Y - 


■ a' 

P' 

Y J 


où (z b a j,/?!, c,) = (z, a, b , c), égalité des 
rapports anharmoniques. 
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3. Le problème de Sturm-Liouville 

Position du problème 

Considérons l’équation différentielle 
linéaire d’ordre n : 

(23) L (u ) = p 0 (0 d n u /dt n 

4 - P\{t)d n - x u/dt n ~ l 4 - ... 4 - p n (î ) u = r{t), 

où pp ), ..., p n {t ), r(î ) sont des fonctions 
continues de la variable réelle i dans 
Tintervalle /E [a, b], et pp ) 0 pour 

t E [a, b). 

Imaginons un ensemble de m condi- 
tions aux limites du type : 

(24) Uffw) = pu(a) + a)u\a) 

4- ... + a^V"- 1 ^) 4- P ?m(6) + P )u\b) 

+ ... + P = y t , 1 < / < m, 

où les a/, p/, Y/ sont des nombres donnés, 
les formes linéaires (24) étant supposées 
linéairement indépendantes par rapport 
aux 2 n variables u(à), u'(a), ..., u {n A} (a), 
u(b), u {n ~ l) (b), ce qui implique m ^ 2 n. 
On se propose de rechercher dans la classe 
des fonctions différentiables jusqu’à 
l’ordre n pour t E [< a , b] s’il existe des 
solutions du système : 

(25) Lm = r(t) 

U/(w) = 7/, 

Il semble commode de commencer 
cette étude par la discussion du problème 
homogène : 

(26) Lu = 0 

U i(u) = 0, 1 < m. 

Pour résoudre (26), il suffit une fois 
construit un système fondamental de solu- 
tions de l’équation L(w) = 0, soit u x {t ), 

w 2 (/), u„(t), de rechercher la solution 

du système (26) sous la forme : 

u = c x u { + c 2 u 2 + ... 4* c„u n , 


les n coefficients ..., c n devant alors être 
calculés par le moyen des m équations 
linéaires à n inconnues : 

n 

(27) Z Cj\Jj(Uj) = 0, 1 < m. 

J= » 

Si le rang de la matrice U ;(uj) est égal 
à p ^ n, il existe n—p vecteurs { c x , c 2 
c n } indépendants vérifiant (27). Si le rang 
de cette matrice est égal à /?, ce qui 
implique m ^ n , le système (27) n’a pas de 
solution hormis la solution banale u — 0. 

Des considérations analogues peuvent 
être développées pour le système (25). 

Le système adjoint 

Supposant que les coefficients pp ) ont des 
dérivées par rapport à t jusqu’à l’ordre 
n —y, introduisons l’opérateur : 

(28) L(«) 

= (— îyd'tpovydt" + (— i )— i,*— î^v)/*— i 
+ ... + ( — \)d(p n __ x y)/dt 4 - p n v 

grâce auquel on obtient l’identité de 
Lagrange : 

vL(tt) — uL(v) = ( d/dt)F(u,v ), 

où P («, v) est une forme bilinéaire homo- 
gène par rapport aux deux ensembles de 
variables u, u, ..., u (n A \ et v, v', v (#ï_,) . 

Par intégration on obtient : 

(29) [v L {u ) — u L(v )]dt 

= P(«, v)| r=ft — P(w,v)| f==û . 

Complétons le système des m formes 
linéaires données U / (w) par 2 n — m 
formes linéaires des variables w(a), ..., 
u {n ~ [) {a) y u(b ), ..., w*"- 1 ^), de telle sorte 
que le système des 2 n formes ainsi obtenu 
soit encore indépendant. On peut montrer 
qu’il existe alors un système de 2 n formes 
linéaires indépendantes des 2 n variables 
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v(a), v'(a ), .... v ( " v(b ), v (/î 1} (6), soit 

Vj(v) ... V 2 „(v) tel que Ton ait l’identité : 

(30) P(«, v)|* — P(m, v)|« 

= U 1 V 2 , + U 2 V 2b _, + ...+U 2 ii V 1 . 

Supposant U,, U 2 , U m fixées, rem- 
plaçons les formes U'^+j, ..., U' 2 „ des 
mêmes variables constituant avec Uj, ..., 
U w un système indépendant. Dans la 
formule (30), les formes V h ..., V 2rt m 
seront alors changées en des formes V',, ..., 
V' 2 „_ m , mais ces deux derniers systèmes de 
2 n — m formes sont équivalents. Le sys- 
tème ... V 2/J m ne dépend donc en tant 
que système de formes linéaires, que des m 
formes données U,, ..., U w , ce qui justifie 
la définition suivante : Le système : 

(31) L(v) = 0 
V/(v) - 0, 

avec / = 1,2, ..., 2 n — m, est dit adjoint au 
système (26). 

Le cas des systèmes différentiels 
autoadjoints du second ordre 

Un cas très important pour les applications 
est celui où : 

L(w) — p 0 (t) d 2 u/dt 2 + P\{t) du/dt + p 2 {t)u. 

Une condition nécessaire et suffisante 
pour que L(w) = — L (u) est que p 0 ' = p { , 
et dans ce cas on peut écrire : 

l/u) = {d /dt)(p 0 du /dt) + PiU. 

Toutefois, si L(u) n’est pas autoadjoint, 
on peut le rendre tel par multiplication par 
un facteur convenable : 



Puisque, ainsi, toute équation du 
second ordre peut être réduite à sa forme 


autoadjointe, on peut se borner à l’étude 
d’équation du type : 

(d /dt)(k du /dt) — gu — r, 

connue sous le nom d’équation de Sturm- 
Liouville. 

Étant donné le problème aux limites : 

L (u ) = {d /dt )(k du /dt ) — gu =0, 

k{t) 0, tE[a,b], 

Uj(m ) = a x u{a) + a 2 u{b) 

+ a 3 w'(a) + a A u\b) - 0, 

U 2 («) = M(<*) + p 2 #(*) 

+ M'(a) + p4 u\b) = 0, 

on peut construire le système adjoint : 

L(v) = (d/dt)(kdv/dt)~gv = 0 

V,(v)«0 

V 2 (v) = 0, 

et chercher sous quelles conditions il est 
autoadjoint, ce qui revient à exprimer que 
le système des formes Uj(m), U 2 (w) est 
équivalent au système Vj(w), V 2 («). On 
montre qu’il en est ainsi si et seulement si : 

d 24 k(a) = d u k(b), avec d i} = a,|3 y — cqP,, 

Exemple : 

U](«) = u\a ) — hu(a), U 2 (w) = u\b ) -f H u (b). 

Le problème de Sturm-Liouville peut 
être posé comme suit : étant donné l’équa- 
tion 

(32) L(u) = (d/dt)(k(t)du/dt)—g(t)u 

— Xr(t)u, 

où k(t ), g(l ), r(t ) sont fonctions continues 
de /, k{t) ^ 0 pour t E [a, b] et les condi- 
tions aux limites : 

(33) U 1 («) = 0, U 2 (w) = 0, 

trouver les valeurs du paramètre X pour 
lesquelles le système (32), (33) a des 
solutions régulières dans t E [ a , b] et cons- 
truire ces solutions. 
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La fonction de Green 

Revenons au cas général de l’équation 
d’ordre n : 

(34) L(m) = p 0 (t)d n u /dt n +/?j (t )d n — l u /dt n ~ 1 

+ ... + p n -\(t) du/dî +p n (t ) u = 0, 

(35) U ; (« ) — 0, 

i = 1, 2, ..., n , Po(l) ¥= 0, ? £ [a, 6]. 

On suppose le système (34), (35) incom- 
patible, c’est-à-dire qu’il n’existe pas de 
solution régulière autre que la solution 
nulle. On peut montrer alors qu’il existe 
une fonction G(/, t\ dite fonction de 
Green, et une seule, satisfaisant aux pro- 
priétés suivantes : 

1. Elle est continue et possède des 
dérivées continues jusqu’à l’ordre n — 2 
inclus par rapport à / G [a, b] ; 

2. Elle est telle que sa dérivée d’ordre 
n — 1 par rapport à t existe et est continue 
pour t G [a, b] sauf en t = t' ; en ce point 
il y a discontinuité de cette dérivée, le saut 
valant 1 /p 0 (t r ) ; 

3. Elle satisfait au système (35) et à 
l’équation (34) relativement à la variable î 
sauf en t = f. 

Si EI(/, f) est la fonction de Green 
associée au système adjoint de (34), (35), 
on peut montrer que G(/, /') — H(r', t) ; en 
particulier, dans le cas d’un système auto- 
adjoint, G(/, f) = G(f', t) et la fonction de 
Green est symétrique par rapport à ses 
deux variables. 

Si le système (34), (35) est incompati- 
ble, le système non homogène : 

(36) Hu) = r(t) 

U, {u ) = 0, 1 < / < n , 

a une solution unique, qu’on construit 
aisément avec la fonction de Green : 

«(O = P G 


Le problème aux limites de Sturm- 
Liouville (32), (33) est donc, sous l’hypo- 
thèse que le système homogène : 

(37) L(m) = 0, U,(w) = 0, U 2 (z/) = 0 

soit incompatible, équivalent à l’équation 
intégrale : 

(38) u (t) = X J* G(J, t ' )r (/')«(/') dt '. 

Exemple de fonction de Green : soit 

L = dVdt\ [a,b] = [0, 1], 

Ui(w) — u (0), U 2 («) — « (1), 

on trouve : 

G(/, O = (1 — f)t, 0 ^ t < f < 1, 

= (1— t)t\ 0 < t’ < t < 1. 

Les fonctions propres 

et la théorie de Hilbert-Schmidt 

Si le système (37) est autoadjoint, la 
fonction de Green G(f, /') est symétrique, 
et si l’on fait l’hypothèse r(0 > 0 , quelque 
soit t G [a, b], posant : 

y ( O = KO] 1/2 w(0, 

R(M') = G(U')[r(0r(Ol I/2 , 

l’équation (38) peut s’écrire : 

(39) y(t) =x£k(*, />(<’)*', 

où le noyau K(/, f) est une fonction 
symétrique continue des deux variables /, 
f dans le carré t G [a, b], t ' G [a, b]. On est 
ainsi conduit à une équation intégrale de 
Fredholm à noyau symétrique. 

Les valeurs X pour lesquelles (39) a des 
solutions non nulles sont les valeurs pro- 
pres, les solutions correspondantes étant 
les fonctions propres. Il est commode, 
pour l’énoncé des résultats, d’introduire ici 
la notion de produit scalaire de deux 
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fonctions f(t ), g{t ) continues dans 
t E [< a , ù] ; on notera ce produit : 

(/i*)-JV(oï(o*. 

où g est la valeur complexe conjuguée de 
g ; / sera dit orthogonal à g si (f\g) = 0. 

On établit les résultats suivants (cf. 
espace de hilbert, théorie spectrale) : 

1. Toutes les valeurs propres de (39) 
sont réelles ; deux fonctions propres qui 
correspondent à deux valeurs propres 
distinctes sont orthogonales. 

2. L’ensemble des valeurs propres est 
dénombrable et n’a pas d’autre point limite 
que l’infini, éventuellement. La multiplicité 
de chaque valeur propre est finie, ce qui 
signifie que le nombre des fonctions pro- 
pres linéairement indépendantes corres- 
pondant à toute valeur propre A est fini. 

On peut donc écrire la suite des valeurs 
propres : 

|X t | < |À2|- < |X,| < .... 
lim | Xj | = °° 

y—* 

et des fonctions propres correspondantes : 
<Pï.<P 2 . 

si la suite est infinie, et l’on peut, grâce 
au procédé d’orthogonalisation de 
Schmidt, faire en sorte que le système des 
fonctions propres cp ; soit orthonormé, 
c’est-à-dire : 

(<P/l<Py) = = 1 si/ = j 

= 0 si / ^ j. 

3. Soit / (/ ) une fonction continue de 

î E [ a , b]. Les nombres (/] = 1, 2, ... 

sont appelés les coefficients de Fourier de 

f 

Avec : 

i*-jW 


on a l’inégalité de Bessel : 

8/1 2 > Jj(/l<P;)| 2 . 
j= 1 

4. Théorème de Hilbert-Schmidt. Soit 
f(t ) une fonction continue de t E [a, b] et : 

(40) Kf =£K(f, 

Le développement de Fourier de K/‘par 
rapport au système orthonormé de toutes 
les fonctions propres cp /} qui s’écrit : 

jr (K/|cp,) 9 j .(r), 

7 = 1 

converge absolument vers K/et uniformé- 
ment par rapport à t El [a, b]. 

Exemple : soit y(t ) une fonction conti- 
nue pourvu de dérivées première et 
seconde continues pour tE [0, 1] et telle 
que >’(0) = >’(1) — 0. Alors y{t ) satisfait à 
y"(t ) — r(t ), r(t ) continue. 

Par suite, y(t ) peut être développée en 
série de Fourier : 

y ( 0 = i a^Vïsin (mtt), 

î 

avec : 

a n = J^Ù) V2 sin (tint) dt , 

la convergence étant uniforme sur l’inter- 
valle [0, 1]. On aura reconnu que 

V'î sin ( mtt ), n— 1 , 2, est le système 
orthogonal des fonctions propres du sys- 
tème y” = X y, y{ 0) = >-(l) = 0. 

La présentation donnée ici, qu’on a 
voulu très élémentaire, a été le point de 
départ de généralisations très importantes 
et très fructueuses qui sont au cœur des 
mathématiques contemporaines (espace de 
Hilbert, opérateurs linéaires, théorie spec- 
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traie, etc.). D’autre part, nous avons sup- 
posé l’intervalle [a, b] fini et les fonctions k , 
g, r continues sur l’intervalle fermé, k(t ) ne 
s’annulant jamais. Si l’une de ces condi- 
tions est omise, les conclusions indiquées 
ne sont plus valables et de nouveaux pro- 
blèmes apparaissent dans le détail desquels 
il est impossible d’entrer ici. Ces problèmes 
sont connus sous le nom de problèmes aux 
limites singuliers et les résultats fondamen- 
taux obtenus dans ce domaine sont associés 
aux noms de H. Weyl, M. H. Stone, 
E. C. Tichmarsh, K. Kodaira, en particu- 
lier le théorème fondamental de dévelop- 
pement qui généralise celui de Hilbert- 
Schmidt (spectre continu) et qui permet de 
donner une présentation unitaire de la 
théorie du développement des fonctions en 
série de Fourier, série de fonctions d’Her- 
mite, fonctions de Bessel, intégrale de Fou- 
rier, etc. 

11 n’est pas sans intérêt, pour conclure, 
de donner quelques brèves indications sur 
le développement historique de la question 
c’est-à-dire la méthode de Sturm-Liouville 
proprement dite. 

Associons à l’équation (32) les condi- 
tions aux limites : 

(41) cq«(a) + a 2 u'(a) = 0 ; 

MÔO + M'(*) = 0; 

on peut définir une solution de (32) satis- 
faisant à la première condition (41), 
u — u(t , X) pour t E [( a , b]. Substituant 
dans la deuxième condition (41), on est 
conduit à résoudre l’équation : 

F(X) = Pi u {b, X) + P 2 u’ib, X) = 0. 

On conçoit que, dans ce but, l’étude des 
zéros de u(t. À) dans l’intervalle [ a , b] et la 
manière dont ils évoluent quand X varie 
puissent être de quelque utilité. Pour cette 
étude, on dispose de théorèmes de compa- 
raison (Sturm), qui, grosso modo, indi- 


quent comment varient ces zéros quand on 
remplace dans l’équation (32) k(t ) et 
p(t ) = X r(t ) + g(t) par des fonctions 
k l (t)etp l (t) telles que k x > k,p { ^ p quel 
que soit t E [< a , b]. 


4. Les systèmes différentiels 
non linéaires 

Les systèmes différentiels 

non linéaires dans le champ réel 

On considère le système différentiel : 

(42) dx/dt=f(x,t), 

où x E R", / (x, t ) une fonction à valeurs 
dans R' 1 , t une variable réelle. On suppose 
/(; v, t ) définie et continue dans l’ensemble 
G X [/ 0 , / 0 + T], où G est un ensemble 
ouvert et borné dans R". 

Avec x 0 donné dans G, on se propose 
de discuter le problème aux limites : 

(43) dx/dt =f(x,t), 

x(t 0 ) = x 0 - 

On peut imaginer le procédé constructif 
suivant : soit t 0 < t] < t 2 ... < t p < ...,une 
suite finie de valeurs de t et : 

x i — x o 4- Ù i — 1 0 )/(x o> * o)> 

*2 =*1 4 - — 


Xp — Xp — ] 4- (t p tp — i }f(Xp — i» tp — 1)> 

et introduisons la fonction .v(/)à valeurs 
dans R" définie par : 

x(t) = x Q + (t — t 0 )f(x 0 ,t Q ), t 0 <t^ti 

= X 1 4 - {t 1 1 )f(x 1 , 1 1 ), 1 1 ^ t ^ 1 2 ' 

La fonction x ( t ) est évidemment conti- 
nue, sa représentation dans R" étant une 
ligne polygonale. On peut espérer, si les 
intervalles t J+ , — tj ne sont pas trop 
grands ou mieux tendent vers 0, que A'(/ ) 
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tendra d’une certaine façon vers une fonc- 
tion x(t ) solution de (43). 

Tel est le principe de la méthode des 
différences finies dont les applications 
débordent largement le cadre de la théorie 
des équations différentielles. On peut éta- 
blir ainsi le théorème : Si /(x, /) est 
continue dans 

G X [t 0 , î 0 -f T], 

où G est un ensemble ouvert et borné de 
R'\ alors pour tout x 0 G G, il existe une 
fonction vectorielle x{t ) solution de (43) 
dans l’intervalle [t, t -j- h], où : 

h = inf (T, d /M), M = su & || f \\ , 

x<EG 

'€[/„. /o + T] 

d étant la distance de x 0 à la frontière de 
G. On pourra prendre pour définition de 
la norme de/, ou de x, \\f ||, \\x\\, la somme 
des modules des composantes ; on a : 

d = sup ô, Ô tel que \\x — x 0 \\ < &=>x£G. 

On notera que cet énoncé exprime 
seulement l’existence d’une solution ; si 
l’on fait l’hypothèse additionnelle : 

(44) || /(*', O || < k | jc' -x" L 

quels que soient (x', x") G G, / G [f 0 , / 0 
T], où k est une constante (condition de 
Lipschitz), alors on peut établir qu’il y a 
unicité. 

D’autre part, les propriétés de la solu- 
tion à l’égard des conditions initiales 
peuvent être appréciées par le résultat 
suivant : si l’on suppose que / (x, / ) a des 
dérivées partielles premières par rapport 
aux composantes de x continues dans 
| x — x 0 1| < Ô, ? G [/ 0 , / 0 -f T], alors la solu- 
tion x(t ) du système (43), qui existe et est 
unique dans t G [/ 0 , / 0 + h], a des dérivées 
partielles premières continues par rapport 
aux composantes de x 0 . 


Une autre méthode d’approche est celle 
des approximations successives, que nous 
avons déjà rencontrée. On fait l’hypothèse 
(44) et l’on définit la suite x { (t ), ..., _v J?I (/ ) 
par : 

dx x /dt =f(x 0 ,t), xj(r 0 )=*o 


dx m + i/dt =f(x m (t),t) i X m (t 0 ) = x 0 


équivalente à : 

*l(0 =x 0 + 

x m + i (O — x o T f r /(x m (t), t) d t 

vt 0 


On montre aisément que cette suite 
peut être construite dans t G [/ 0 , t 0 + h] et 
converge uniformément dans cet intervalle 
vers une fonction x(/ ) solution de (43) ; le 
même type d’argument permet d’établir 
l’unicité (cf. chap. 7 Intégration numérique 
des équations différentielles pour l’aspect 
numérique). 

Les systèmes différentiels 

non linéaires dans le champ complexe 

On peut développer des théorèmes d’exis- 
tence locale assez voisins de ceux qui sont 
décrits dans le cas précédent. Mais l’étude 
des solutions d’un point de vue global est 
très instructive et amène à des distinctions 
intéressantes lorsqu’on discute de leurs 
singularités. 

Celles-ci sont, en général, de deux 
sortes : les singularités fixes qu’on peut 
prévoir a priori d’après la nature du 
système différentiel donné et celles qui sont 
mobiles, c’est-à-dire dépendent des condi- 
tions initiales. Pour simplifier, on se bor- 
nera, dans l’exposé qui suit, au seul cas des 
équations différentielles non linéaires. 

Dans le cas d’une équation du premier 
ordre : du/dz = f (z, ü), f fonction analy- 
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tique de z et rationnelle en u , on démontre 
qu’il ne peut pas exister de singularité 
essentielle mobile, quoique des singularités 
mobiles plus simples puissent apparaître 
(pôle ou point de branchement). Exemple : 

du /dz + z/u — 0, u — VzJ + u 2 — z2 > 

u(z 0 ) = u 0 . 

Mais, dans le cas d’équation du second 
ordre, ou d’ordre plus élevé, des singula- 
rités essentielles mobiles peuvent apparaî- 
tre comme l’indique l’exemple suivant : 

d 2 u _ (du\ 2 2u — 1 
dz 2 V dz ) u 1 + 1 

qui a la solution générale : 

u = tan [In (A z — B)] ; 

A et B sont les constantes d’intégration, 
z = B/A est la singularité essentielle 
mobile. 

Le problème se pose alors de détermi- 
ner s’il existe ou non des équations diffé- 
rentielles du second ordre : 

d 2 u/dz 2 = F(z, u,du/dz ), 

où F est fonction analytique de z et 
rationnelle en u et dujdz telles que les 
points de branchement et singularités 
essentielles de toutes leurs solutions soient 
fixes. 

Par une méthode de réductions succes- 
sives on est conduit à cinquante types 
d’équations admissibles, tous étant inté- 
grables au moyen de fonctions connues, 
sauf six ; les équations les plus intéressan- 
tes sont, bien entendu, celles, irréductibles, 
au nombre de six, qui servent à définir les 
transcendantes de Painlevé. On se bornera 
à écrire les deux plus simples : 

d 2 u /dz 2 = 6u 2 4- z, d 2 u/dz 2 = lu 1 -f zu + a. 

On démontre que les solutions de ces 
équations n’ont pas de singularité essen- 


tielle ni de points de branchement mobiles. 
Et mêmes elles n’ont pas de point de 
branchement et définissent ainsi des fonc- 
tions uniformes. 


5. La théorie de la stabilité 

Pour la description mathématique de très 
nombreux systèmes physiques oscillatoires 
on est conduit à des équations ou systèmes 
différentiels dont il convient de rechercher 
les solutions stationnaires ou périodiques 
et d’étudier leurs propriétés de stabilité. 

Un modèle relativement simple est 
fourni par l’équation : 

(45) dx /dt = Ax + 

où a* E R", A matrice n X n réelle et 
constante, / (a, t ) application continue 
de : 

U X [0, <»] 

dans R", U étant un voisinage de l’origine, 
telle enfin que /(O, / ) — 0. Il est clair que 
a — 0 est solution de (45) ou, comme l’on 
dit, un point critique. Mais que peut-on 
dire d’une solution dont la valeur initiale 
a(0) est petite ? Sera-t-elle définie pour tout 
t > 0, et, dans l’affirmative, va-t-elle 
s’écarter notablement ou non de la solu- 
tion d’équilibre a — 0. Cela amène à 
préciser le concept suivant de stabilité : 
une solution a(/ ), du système 
dx/dt = F(a, t ) définie pour tout t ^ ? 0 
sera dite stable si, pour tout e > 0, il 
existe ô = ô(e, t 0 ) > 0 tel que toute autre 
solution y{t ) définie pour t > et 

vérifiant || v(/ 0 ):— a(/ 0 ) || < Ô satisfait à 
||><0-*(OH < e pour t ^ / 0 . 

Si, de plus, y(t ) — a(/ ) — + 0 quand 
t _|_ oo, on dira que la solution a (t ) est 
asymptotiquement stable. 
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On observera que, pour discuter la 
stabilité d'une solution x(/ ) d'un système 
quelconque dx/dî — F(.y, / ), on pourra 
toujours. par le changement 
x = x (t ) y, se ramener à l'étude de la 
stabilité d’une solution stationnaire d’un 
système différentiel, ce qui justifie l’impor- 
tance de système du type (45). 

Revenant à ce cas, on peut énoncer le 
théorème (Poincaré-Liapounoff) : Si les 
valeurs propres de la matrice A ont toutes 
leur partie réelle négative et si la fonction 
/(x, t ) continue dans j|x|| < p, t ^ 0 est 
telle que : 

lim sup \\f{x,t)\\/\\x || = 0, 

x — 0 ; > 0 

x = 0 est solution asymptotiquement sta- 
ble de (45). 

Si l’une au moins des valeurs propres de 
A est à partie réelle positive, la solution 
x = 0 est instable. 

Le théorème de stabilité demeure vrai si 
la matice A est une fonction continue 
périodique de t dont tous les coefficients 
caractéristiques sont à partie réelle néga- 
tive. 

Le problème fondamental de la stabilité 
de la solution x = 0 du système : 

(46) dx/dt = F(x, t), avec F(0, t) — 0 

peut être abordé par la méthode directe de 
Liapounoff. 

Pour en expliquer le contenu, il faut 
donner quelques notations préliminaires : 
on dira que la fonction scalaire V(x, i ) a 
un signe constant si, dans un domaine 
Q(tf, r ) : ]|x|| ^ a, t ^ t, convenable, elle 
est différentiable, ne prend que des valeurs 
d’un même signe ou nulle et V(0, t ) = 0 ; 
elle sera dite positive ou négative selon la 
nature de ce signe. 

Si W(x) est une fonction scalaire indé- 
pendante du temps, on dira que W(x) est 


définie positive (ou définie négative) si elle 
est différentiable, et est positive (ou néga- 
tive) dans un Q(a , r) convenable et ne 
s’annule qu’à l’origine. La fonction sca- 
laire V(x, t ) sera dite définie positive (ou 
définie négative) s’il existe une fonction 
définie positive W(x) telle que V — W (ou 

- V — W) est positive dans un Q {a, t) et 
V(0, t ) = 0. 

Supposant que F(x, t ) est continue 
dans un O (a, r) convenable, on a les 
théorèmes suivants : 

- Si, pour le système (46) et dans un 
domaine Q(tf, r), il existe une fonction 
définie V(x, t ) dont la dérivée : 

dV/dt = dV/dt + F,(;c, t) dV/dx h 

est d’un signe constant opposé, alors 
x = 0 est solution stable de (46). 

- Si, pour le système (46) et dans un 
domaine Q (a, t), V(x, t ) et dV/dt sont 
définies et de signe contraire et si 

lim sup | V(x, t) | = 0, 

x * o r ÿ t 

alors x — 0 est une solution asymptotique- 
ment stable de (46). 

Si, pour le système (46), on a pu 
construire une fonction V(x, t ) telle que : 

lim sup î V(x, t) | = 0, 

X — 0 t > T 

telle que dV/dt soit définie (positive ou 
négative) dans Q(cz, r), et que, pour chaque 
valeur t > r et chaque q > 0 aussi petit 
qu’on veut, V et cN/dt puissent avoir, en 
certain point de ||x|| < q, le même signe, 
alors x — 0 est solution instable du sys- 
tème (46). 

La difficulté d’application de ces théo- 
rèmes réside, bien entendu, dans la cons- 
truction des fonctions de Liapounoff ; 
aussi de nombreux efforts ont été tentés 
visant, d’une part, à assouplir les condi- 
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tions imposées dans l’espoir de rendre plus 
facile cette construction, d’autre part, à 
reconnaître parmi ces conditions celles qui 
sont nécessaires pour tel type de stabilité. 

Voici, pour conclure, un exemple 
d’application. Soit le système : 

(47) dx/dî « A(t)x +f(x,t), 

où A(t ) est une matrice n X n fonction 
réelle continue et bornée dans O 0, 
/ (x, t ) application à valeurs dans R", 
continue dans ||x|| < a, t ^ 0, et telle que 

lim sup || / (x, 0 || / || jc || = 0 ; 

s’il existe une fonction de Liapounoff pour 
l’approximation linéaire dxjdt = A(t)x, 
c’est-à-dire une fonction V(x, t ) satisfai- 
sant pour ce système linéaire aux exigences 
du troisième théorème énoncé plus haut, 
alors x = 0 est une solution asymptotique- 
ment stable de (47). 

6. Les solutions périodiques 

des systèmes différentiels 

Un problème très important pour certai- 
nes applications est la recherche de solu- 
tion périodique de système du type 
dxjdt = f (x, t ), où / (x, t ), application 
continue dans R", est supposée périodique 
par rapport à la variable réelle t de 
période T (cas non autonome), ou encore 
du type dxjdt — f (x) (cas autonome). 

On ne dispose d’aucune méthode 
d’investigation assez puissante pour répon- 
dre à ces questions de manière générale. 
Les méthodes existantes sont de deux 
sortes. Les unes, méthode de perturbation, 
méthode de centrage, permettant l’étude 
de systèmes quasi linéaires, c’est-à-dire de 
systèmes dans lesquels la partie non 
linéaire apparaît multipliée par un para- 


mètre qu’on suppose petit ; le calcul de 
représentations asymptotiques des solu- 
tions périodiques est généralement possi- 
ble, ainsi que l’étude de la stabilité de ces 
solutions. Les autres sont des méthodes 
topologiques qui fournissent pour certains 
systèmes fortement non linéaires des résul- 
tats d’existence de solutions périodiques. 

La méthode des perturbations 
(H. Poincaré) 

Considérons l’équation : 

(48) x" + x = \jf (x, x', w t, a), 

où x est une fonction scalaire, x' — dxjdt, 
x " — cPxjdt 2 , /fonction périodique de / de 
période 2 ir/o et p un petit paramètre, tous 
les éléments ainsi définis étant réels. 

Quand p = 0 l’équation se réduit à 
x" + x — 0 qui a pour solution générale 
x — a cos (t + tp), périodique de période 
2 7T, a et cp désignant des constantes 
arbitraires. 

Supposons que o) est voisin de l’unité ou 
mieux que w -2 = 1 — pq, rj étant une 
fonction donnée de p analytique dans le 
voisinage de 0, 

h(m) = n* m*- 
L * = 0 

Pour chercher si l’équation (48) a des 
solutions périodiques de période 2 tt/co, 
nous posons w / = 0 + Ô, 0 nouvelle 
variable, ô paramètre de translation. Il 
vient ainsi : 

(49) x" + x = \ig(x, x\ 0 + 5, m, n)> 
avec x' — dx/dQ, x" — d 2 x/dd 2 , 

et : 

g = r\x + (1 — \xnY{x,x7{\ — gr]) 1/2 > Ô -I- ô,g), 

et l’on recherche une solution périodique 
de (49) de période 2 tt en 0, telle que 
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,y(0) — a , x'(0) = 0 (cette condition ini- 
tiale fait comprendre le rôle du paramètre 
de translation ô). La théorie de Poincaré 
montre que si a et Ô 0 sont solution réelle 
du système d’équations : 

J 27r sin r X / (a cos r, — a sin t, r + Ô 0 , 0) d t = 0, 

p2TT 

7rr| 0 a + cos t 

X /(a cos t, — a sin t, t + ô 0 , 0) d r = 0, 
telle que : 

f sinT 

X (df /d 0) {a cos t, — a sin r, r + ô 0 , 0) d t = 0, 

et si g(x, a'\ 0 + ô, p, rj) continue par 
rapport à tous ses arguments peut être 
développée en série de puissances de 
x — a cos 0, x' + a sin 0, p, r\ — r| 0 , Ô — Ô 0 
convergente pour tout 0 si tous ces 
arguments sont de module moindre 
qu’un nombre positif p, alors il existe 
une solution périodique de l’équa- 
tion (48) que l’on peut représenter par la 
série : 

(50) x (6) = a cos 0 + ^ 7„(0) jli" . 

î 

Celle-ci peut être dérivée terme à terme 
deux fois, et : 

(51) x'(G) = — a sin 0 + ^ y' (0) g", 

î 

*"(0) — — a cos 0 + ^ y"(0) M n - 
i 

On peut représenter Ô par une série : 

(52) ô = ô 0 + jliÔj + ... 

et l’on peut obtenir les développements 
(50) et (52) par substitution dans l’équa- 
tion (49) et identification dans les deux 


membres des coefficients des mêmes puis- 
sances de p. On obtient ainsi un système 
récurrent : 

Y' + Y« = <P«( 7i> •••» ..., Ô B — j), n > 1. 

On détermine les y„(9) et l es coeffi- 
cients b k en imposant aux fonctions y ;J 
la condition de périodicité par rap- 
port à 0 de période 2 t r et en plus : 
7.(0) = V„(0) = 0. 

Cette méthode de calcul appliquée à 
l’équation de Duffing : 

x " + x + p * 3 = \\h cos wr, 

avec co -2 = 1 — pr|, h constante, conduit 
à : 

h 0 — 0, r\ 0 a + h — 3a 3 /4 = 0. 

On peut donc obtenir trois solutions 
périodiques, et en tout cas au moins une ; 
on a la représentation : 

x = a cos 0 

+ p(a 3 /32) ( — cos 0 + cos 3 0) + 0(g 2 ), 

0 = ü) /, (o - 2 =1 — piio + 0(p 2 ) 

La théorie qui précède permet de 
donner une description satisfaisante du 
phénomène de synchronisation des oscil- 
lateurs quasi linéaires. Si l’oscillateur 
linéaire est attaqué par une force pério- 
dique non linéaire de période voisine de 
sa période propre, il y a synchronisa- 
tion sur la force excitatrice, l’oscillation 
ayant en outre une amplitude bien 
définie. 

La théorie de Poincaré permet aussi de 
rendre compte du phénomène de démul- 
tiplication de fréquence, c’est-à-dire l’exis- 
tence de solutions sous-harmoniques, 
périodiques de période multiple de celle de 
la force excitatrice. Ces résultats d’une 
grande importance théorique et pratique 
sont spécifiques de la non-linéarité. 
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Le cas des systèmes autonomes peut 
être traité de façon similaire ; considérons 
par exemple l’équation : 

(53) *" + * = \rf(x,x\ m) 

et proposons-nous de chercher s’il existe 
une solution périodique de (53) qui, lors- 
que jlx — > 0, tend vers une solution bien 
déterminée de x" + x = 0, périodique de 
période 2 tt. Cela suggère que la période de 
la solution cherchée 2 tt/o> peut être repré- 
sentée par (j)~ 2 = 1 — juq, où q(p) est une 
fonction de ju qui, à la différence du cas 
précédent, est une inconnue du problème. 
Avec cette représentation et la nouvelle 
variable o) t = 0, l’équation devient : 

(54) *"+* 

= ju(rpc + (1 — wY (x, *7(1 — Mn) 1/2 , M)) 
= M g(x,x' t u, îl), 

dont il convient de rechercher une solu- 
tion périodique de période 2 t r. On peut 
alors démontrer suivant la méthode de 
Poincaré que si a 0 et q 0 sont des nombres 
réels satisfaisant aux équations : 

J 2 * sin t/(û 0 cos t, — a 0 sin r, 0) d t = 0, 

r TT 

COS T 

X f (p o cos t, — a o sin t, 0) d t = 0, 

tels que : 

f2ir . 

a o J sin t 

X [cos t {ôf /dx )(a 0 cos r, — a Q sin r, 0) 

— sin t ( ôf /dx' )(a 0 cos r, — a 0 sin t, 0)] d t ^ 0. 

Si, en outre, g(x, x', p, q) peut être 
développé en série de puissances de x — a 0 
cos 0, x + a 0 sin 0, p, q — q 0 convergente 
lorsque ces quantités sont de module assez 
petit, alors il existe une fonction q(p) pour 
laquelle (54) possède une solution pério- 
dique x(0) de période 2 ir telle que 


x(0) = a 0 , x'(0) = 0, qu’on peut représen- 
ter par les séries : 

n(u) = n 0 + uni + u 2 n 2 + 

x(0) = a 0 cos 0 + ^(0) M + ... 

Le développement de x(0) peut être 
dérivé terme à terme deux fois et l’on peut 
obtenir les coefficients de ces séries par 
substitution dans (54) et identification 
dans les deux membres des termes de 
même puissance en ju. 

La détermination de y„(0) et q* se 
fait alors par un procédé récurrent : 

Y\ + 7n = <P(Yi. T«- 1 . ni -, n„ i) et 
les conditions y n (0) — 0, y' tt (0) = 0, avec 
Y„(0) périodique de période 2 tt. 

Appliquant ces considérations à l’équa- 
tion de Van der Pol : 

x" + u(x 2 — IX + x = 0, 

on trouve ainsi : 

jj= 1 +£ + o(u>), at = e 

(O o 

x (0) = 2 cos 0 + ^ ~ sin 0 — i sin 3 0 j m 

+ ( — ^cos0 + jç cos 3 0 — ~ cos 5 0 ^ m 2 

+ 0(|P). 

La méthode de centrage 
(Kryloff-Bogoliuboff-Haag) 

a ) Considérons le système : 

(55) dx /dt = m/ (*, t y ja), 

avec A' G K n , / application à valeurs dans 
R”, périodique par rapport à t de période 
T et pourvue de dérivées partielles premiè- 
res continues. L’idée fondamentale est de 
substituer à (55) l’équation : 

(56) dx/dt — uF(x) 

avec : F(*) = (1/T) J T /(x, /, 0) dt. 
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On peut établir que les solutions x(t ) 
et x(t ) respectivement de (55) et (56) 
qui prennent pour t = 0 même valeur 
demeurent assez voisines sur un intervalle 
de temps d’autant plus grand que p est 
plus petit. De manière plus précise, 
sous certaines hypothèses, on établit qu’il 
existe une fonction croissante h(t ) telle 
que : 

!U(0 — *(0 II < m^(mO- 

Ce résultat signifie essentiellement que, 
choisissant p assez petit, l’écart entre les 
solutions sera moindre qu’un nombre 
donné e sur un intervalle de temps qui sera 
de l’ordre de p ', donc très grand si p est 
petit : 

p < e/h( L) =>!!*(?) — *(/) || < 6, 

pour t E [0, L/p] et a fortiori pour 
rE[0, L/?(L)/e], 

b) D’un autre côté, cette méthode per- 
met de prévoir aussi l’existence de solu- 
tions périodiques et d’étudier leur stabilité. 

Plus précisément, on a le théorème : Si 
a E R" est tel que F(a) = 0, et si la 
matrice : 

(dF'/dxjXa) = (1/T) £ (df t /dxj)(a, t , 0 )dt 

est non singulière, alors le système (55) 
possède une solution périodique de 
période T pour p assez petit, qui, lorsque 
p — ► 0, tend uniformément vers a ; de plus, 
si les valeurs propres de cette matrice ont 
toutes leurs parties réelles négatives, la 
solution périodique mise en évidence est 
asymptotiquement stable. 

De nombreuses extensions sont possi- 
bles et pour conclure nous citerons un 
résultat fondamental : soit le système quasi 
linéaire : 

(57) dx/dt = Ax + /(/) + pF(x, t, p), 


où A est une matrice réelle n X n cons- 
tante, f(t) et F(x, r, p) des applications 
dans R” périodiques en t de période T, F 
pourvue de dérivées partielles du premier 
ordre continues. 

Si aucune valeur propre de la matrice 
A n’est égale à ± 2 7T iqf T, q entier, alors 
pour p assez petit, le système (57) a une 
solution périodique unique de période T, 
asymptotiquement stable si les valeurs 
propres de A sont toutes à partie réelle 
négative. 

Si certaines valeurs propres de A sont 
multiples de ± 2 tt if T, alors le système 
dx/dt — Ax possède un système maximal 
de solutions périodiques de période T, 
cp w (f ) de composantes cp,y (/ ) avec 1 < j < 
m ^ n. Le système adjoint : 
dx/dt + *Ax = 0 ('A matrice transposée 
de A) possède aussi un système maximal de 
m solutions périodiques de période T, 
i \) (k) (t ) de composantes ip /A .(/ ), qu’on peut 
toujours supposer construit de telle sorte 
que : 

< cptf), y**) > = ^ <Pÿ(0 WikiO = §jk- 

i 

Le système linéaire non homogène 
dx/dt = Ax +/(/ ), sous réserve que l’on 
ait : 

( 58 ) \s ),f(s))ds 

= J:(Z^))^a 

j = 1 

pour 1 ^ k < m, possède alors une 
famille de solutions périodiques de période 
T, qu’on peut écrire : 

*(0 = ctjcpwto + ... + a m <p<"0(0 + Jc(0. 

où les a, sont des constantes arbitrai- 
res. 
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Revenant au système (57), on écrit les 
équations : 

(59) h p (a u ..., a m ) 

= ip*fr)F,(x(s)»s» 0)^jds = 0, 

7=1 

avec 1 < p < m, on suppose qu’il existe 
un système de valeurs réelles a?, a° m 
solution des équations (59) telles que le 
jacobien : 

é(*i, 

d(a lf a m ) 

ne soit pas nul pour cet ensemble de 
valeurs. 

Alors le théorème de Malkin affirme 
que, sous réserve des conditions (58), pour 
p assez petit, le système (57) possède une 
solution périodique de période T qui, 
lorsque p — * 0 tend vers : 

x(r) = ajcp0)(0 + ... + a°(p< m >(0 + *(0- 

Il est généralement possible de déter- 
miner les termes suivants du développe- 
ment asymptotique de la solution par 
rapport à p et d’en étudier la stabilité. 

Ajoutons, pour conclure, que ces 
méthodes permettent aussi de discuter du 
cas des systèmes autonomes, et que 
d’importantes généralisations sont possi- 
bles, en particulier pour l’étude des systè- 
mes presque périodiques. 

Les méthodes topologiques 

Considérons le système différentiel : 

dx =f(x,t ), 

avec / à valeurs dans R", périodique en t 
de période T. Sous certaines conditions, on 
peut définir la solution x(t ; A' 0 ) de (59), qui, 
pour t — 0, prend la valeur .v 0 , valable 
pour t G [0, T]. 


Définissant l’opérateur J.v 0 = .y(T ; _v 0 ) 
de R" dans R", l’on voit que, pour obtenir 
une solution périodique de période T de 

(59) , le problème fondamental consiste à 
trouver un point fixe de cet opérateur, 
c’est-à-dire x 0 tel que : ,v 0 = J.y () . 

On peut présenter cette idée de manière 
différente ; proposons-nous, par exemple, 
de rechercher la solution périodique de 
période T du système : 

(60) dx/dt = &(t)x + g (x,t), 

où A(/ ), g(x, t ) sont respectivement 
matrice n X n, applications dans R" pério- 
diques en t de période T. On suppose que 
le système homogène : 

(61) dx/dt — A(0* 

n’a pas de solution périodique de période 
T. 

On introduit, pour le système matri- 
ciel : 

(62) dZ/dt = A(/)Z 

(63) Z(0) = Z(T), 

une matrice n X n , G(/, /') (matrice de 
Green) satisfaisant aux propriétés suivan- 
tes : G(r, t') vérifie (62) pour 0 < t < t' et 
< t ^ T, satisfait à (63) relativement à 
/, enfin est discontinue en t — t’ avec un 
saut : 

G(f — — = I. 

Si X(/ ) est la matrice résolvante de (62) 
alors X(T) — I est inversible (car (61) n’a 
pas de solution périodique T) et l’on peut 
montrer que : 

G(f, t') — 

{ x(0[i— x(T)]- l x-‘(o, o < r < t < t, 

1 X(r)[I — X(T)]-' 1 X(T)X- 1 (/'), 0 < t < t' < T. 

On s’assure facilement que toute solu- 
tion périodique de période T de (60) est 


242 


DIFFÉRENTIELLES équations 


solution de l’équation intégrale non 
linéaire : 

(64) * (o = J o t g (t,n g (x(t'),ndt\ 

et inversement. 

Si Ton considère le second membre de 

(64) comme un opérateur J agissant sur 
l’espace des fonctions continues x(t ), 
/ G [0, T], on voit que le problème consiste 
à trouver un point fixe de cet opérateur, 
c'est-à-dire une fonction continue x(î ) telle 
que .y — J .y. 

La théorie des points fixes des opéra- 
teurs non linéaires a reçu dans les dernières 
décennies un développement considérable 
et a rendu possible la recherche de solu- 
tions périodiques de systèmes différentiels 
dans de nombreux cas. 

Nous allons, pour conclure, ajouter 
quelques développements dans le cas 
des systèmes autonomes de dimen- 
sion 2. 

Soit le système : 

(65) dx/dt = f(x,y) 
dy/dt = g{x,y ), 

x, y, variables scalaires, /, g , fonctions 
réelles continues au sens de Lipschitz 
dans un ensemble D ouvert et borné du 
plan x, y. 

Si C + (ou C“) est une semi-orbite de 
(65), c’est-à-dire l’ensemble des points P(/ ) 
dont les coordonnées sont c p(t ), i \>{t ), 
solution de (65) définie dans t > î 0 (ou 
/ ^ / 0 ) pour un certain r 0 , un point Q du 
plan sera dit point limite de C + (ou de C ) 
s’il existe une suite de nombres réels 
t n ~+ oc (ou t n — ► — oc) telle que 
P(U-+Q, si* — ► oo. L’ensemble de tous 
les points limites d’une semi-orbite C + (ou 
C ) est désigné par (L(C + ) L(C )), et 
L(C) = L(C + ) U L(C _ ) est l’ensemble 
limite de l’orbite. 


On a les théorèmes suivants : 

- Si C + est une semi-orbite contenue dans 
un ensemble fermé K C D, alors L(C + ) est 
non vide, fermé et connexe. 

Définition. Les points de D en lesquels 
/ et g s’annulent sont les points criti- 
ques ; tout autre point de D sera dit 
régulier. 

- Soit C + une semi-orbite positive conte- 
nue dans un sous-ensemble fermé K C D 
et supposons que L(C + ) contienne un 
point régulier Q. Alors L’orbite C Q passant 
par Q existe en tant qu’orbite complète 
/ G ] - », + oo [ et C Q C L(C+). 

- Soit C + une semi-orbite positive conte- 
nue dans un sous-ensemble fermé K C D. 
Si L(C + ) se compose exclusivement de 
points réguliers, alors C + (= L(C + )) est 
une orbite périodique ou L(C + ) est une 
orbite périodique ; dans le second cas, on 
dit que L(C + ) est un cycle limite. 

- Corollaire ( théorème de Poincaré - 
Bendixson). Si C + est une semi-orbite 
contenue dans un sous-ensemble compact 
K C D, dans lequel il n’y a pas de point 
critique, alors K contient une orbite pério- 
dique. 

Si T est la période et si : 

*-r 

cette intégrale étant calculée sur le cycle, 
celui-ci est asymptotiquement stable. 

Voici, pour conclure, l’exemple suivant 
(équation de Liénard) : x” -\- x =f (.V), 
qu’on écrira : 

dx /dt — y 
dy/dt ~f(y) — x. 

On suppose f(y) pourvue d’une dérivée 
continue et telle que / OO = gCy) — ay\ a 
constante avec dg/dy > 0, dg/dy{ 0) > a, 
g( ->•) = - g( - y), | g(y) | < C, c cons- 
tant ; le théorème de Poincaré-Bendixson 
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peut être utilisé dans ce cas pour mettre en 
évidence un cycle limite. 

Soit E un espace topologique ; un 
système dynamique est une famille d’opé- 
rateurs F, (/ E R) de E dans E possédant 
les propriétés suivantes : 

a) F 0 est l’opérateur identité, 

b) pour tous t h t 2 réels F /( + , = F^F^, 

c) l’élément ¥p de E dépend continû- 
ment de (/>,/) G E X R. 

En particulier si l’on prend pour E 
l’espace R /7 et si /(x, t) est une fonction 
continue de R" X R dans R", lipschit- 
zienne en x, on peut définir x(/, x 0 ) 
la solution unique du système : 
dxjdt =/(x, / ), x(0, x 0 ) = x 0 , puis la 
famille d’opérateurs F, : R"— *R définie 
par F, (x 0 ) = x(/, x 0 ), laquelle constitue un 
système dynamique au sens de la définition 
donnée plus haut. 

L’étude des systèmes dynamiques cons- 
titue donc un prolongement naturel de la 
théorie des équations différentielles et a 
donné lieu à de nombreux travaux : pro- 
blèmes de stabilité, problèmes ergodiques 
(cf. théorie ergodique), etc. 

Une autre généralisation importante 
consiste à considérer des équations diffé- 
rentielles dans lesquelles la fonction incon- 
nue a des valeurs dans un espace métrique, 
par exemple un espace de Hilbert ou un 
espace de Banach. 

On peut ainsi discuter des équations du 
type : 

dx/dt — Ax, dx /dt — Ax +/ ( x , t), 

où x est pour toute valeur réelle de t 
élément d’un espace de Banach E, A 
désignant un opérateur linéaire de E dans 
E, / (x, t ) application non linéaire de 
E X R dans E. 

Dans le cas où l’opérateur A est indé- 
pendant de t, sous certaines conditions 
additionnelles, l’étude de l’équation 


dx/dt — Ax conduit à la théorie bien déve- 
loppée des semi-groupes d’opérateurs dans 
E. Le cas des équations non linéaires a été 
aussi considéré en liaison avec les problè- 
mes d’évolution, la question se posant, en 
général, de savoir comment se comportent 
pour t ^ + oo les solutions de tels systèmes. 

Le développement considérable de 
l’analyse fonctionnelle a beaucoup contri- 
bué aux progrès de ces théories dont 
l’étude se poursuit activement. 

MAURICE ROSEAU 


7. Intégration numérique 
des équations différentielles 

Méthode d'Euler 

Prenons d’abord le cas d’une équation 
différentielle du 1 er ordre : Trouver y, 
fonction d’une variable x, dérivable sur 
[x 0 , x 0 + a] = I, telle que,/ désignant une 
fonction continue sur I X R, 

y\x) =f(x,y(x))> 

pour tout x G I, et : 

y(x o) = X 

où X est donné dans R. 

L’idée est de remplacer le problème 
théorique précédent, noté P, par le pro- 
blème discrétisé P„ suivant (méthode 
d’Euler) : Trouver Y„ = (y 0 , y y„), 
suite finie de n + 1 nombres réels telle 
que : 

yt+î =y, + < j;f(x l ,y i ), — 1, 

où : 

ia , 

*<=*o + — » = X ; 

n 

ce problème P„ est obtenu en divisant 
I = [a 0 , x 0 + a] en n parties égales avec un 
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pas égal à h = ajn et en cherchant une 
approximation y i de y(Xj) où y est la 
solution (lorsqu’elle est unique) de Pj. 

Le raisonnement, fort simple, est le 
suivant : Si y est solution unique de P,, 
y'(Xj) est proche de : 

y(Xj+ 1 ) —yi*.) 
h 

et donc, si y { est « proche » de on 
peut remplacer P L par P /r 

P„ est un problème discrétisé associé à 
P,. On remarque alors immédiatement 
qu’une notion importante va devoir être 
précisée : comment dire que la solution de 
P w converge vers celle de Pj lorsque n tend 
vers -j- oo. L’analyse numérique devra 
fournir des majorations pour | yfv,) — y t |. 

Dans la suite, nous supposerons tou- 
jours que / satisfait à la condition (L) 
suivante appelée condition de Lipschitz 
globale : il existe L ^ 0 tel que : 

|/(x,«)-/(x,v)|< L|«-v|, 

pour tout jc G I, «ER et v G R. 

Cette condition assure l’existence et 
l’unicité du problème P (cf. chap. 4). 

On peut espérer que, si h est assez 
petit, le nombre y, est proche de >’(à',). 
C’est pourquoi le nombre c, = y(x f ) — vi- 
sera appelé l’erreur au point x h tandis 
que : 

E„ — max | e f 1 
0 $ ; s? * 

est l’erreur globale aux points x h 
0 ^ ^ n. 

Le procédé P /? est dit convergent si : 
lim E„ = 0. 

Notons que cette notion de conver- 
gence est peu habituelle ; car la solution de 
P est une fonction x j(a), alors que la 
solution Y„ de P„ est une suite finie de 


n + 1 nombres réels. Ainsi, y et Y„ 
n’appartiennent pas au même espace et 
nous ne pouvons pas mesurer une distance 
éventuelle de y à Y, r Néanmoins, cette 
notion de convergence satisfait le physi- 
cien, qui ne cherche pas explicitement 
y mais qui veut surtout des valeurs 
approchées de y(x,) pour un certain pas h. 
Si E„ est petit, l’erreur de discrétisation 
provoquée par le passage de P à P /7 est 
faible. 

Théorème. Si (L) est satisfaite, le pro- 
cédé P„ est convergent. Plus précisément, 
on peut montrer que : 

e u*/— -* o) — i 

Kl < l ma x | y \t t ) — y\t 2 ) | 

< 6 L 1 max \y '{t t ) — y \t 2 ) | , 

où les maximums sont pris pour t\ G 1, 
t 2 G I, avec 1 1\ — t 2 1 < h. 

Cette majoration prouve la conver- 
gence ; car, / étant continue, la solution 
unique de P possède une dérivée continue 
sur I, donc uniformément continue, de 
sorte que le maximum ÿ{t x ) — y(/ 2 )> pour 
\t\— 1 2 \ ^ h , tend vers 0 avec h. 

Néanmoins, cette majoration ne donne 
pas de bornes pour l’erreur commise, car 
elle fait intervenir la dérivée de la fonction 
inconnue. 

Cherchons une majoration de E„. Pre- 
nons tout d’abord (L) comme seule hypo- 
thèse. On peut alors montrer que la 
solution unique de P satisfait à : 

I^C^) — J^ol < l), 

où : 

Kl = max |/(x,y 0 ) I ■ 

Une majoration de est en général 
assez simple à déterminer, de sorte qu’on 
peut définir un ensemble borné ‘JO de 
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I X R qui contient (x, >(x)) tel que y soit 
solution de P. C’est l’ensemble 3), défini 
par : 

*ei. 


Si, sur 3), qui est un ensemble borné 
fermé, la fonction / possède des dérivées 
partielles continues : 

0 / £/ 


on peut alors majorer | e { | par : 


L 1 p û 11, 

T-Vu — 


+\\/\\ 


)h, 

‘J) / 


Remarquons que cette majoration est 
utilisable si on peut calculer aisément : 


0/ V 

et si on peut majorer simplement : 


0 / 
dx CD 


max d /x {X ' y) 


où le maximum est pris pour (x, y) E 3), et 
de même pour : 


Wfh, 


àf 

dy cd * 


Le résultat final est alors 


E„ < Kh = K-- 

n 

Ainsi, la convergence est en l/n. On 
peut l’accélérer par la méthode d’extrapo- 
lation à la limite (méthode de Richardson, 
ou encore de Romberg ; cf. représentation 
et approximation des fonctions). 

La méthode d’extrapolation à la limite 
est très facile à appliquer. On peut, 
par exemple, diviser I en « parties éga- 
les, prendre pour x = x, 0 un des points 


de subdivision, puis diviser en 2 n par- 
ties égales en écrivant x = x, (1) , puis 
en 4 n partie égales en posant x i{2) = x, 
puis en 2 fn parties égales en posant 

X i(p) X ' 

On résout alors les p schèmes : 

— y m + hf ( x mi y j(k)\ 

et on obtient y i{k) pour 1 ^ k < p. 

Si / est suffisamment différentiable sur 
3), les conditions d’application de l’extra- 
polation à la limite sont satisfaites et on 
peut remplacer y i(p] par une moyenne 
convenable : 


Pm = 


p 

k = 1 


telle que y i{p) converge vers >>(x) plus vite 
que y i(jy) lorsque p tend vers + oo. 


Une famille de méthodes numériques 

Nous avons jusqu’ici remplacé P par P ;I : 

J\+1 =yi + hf(Xi,yi), y o = X. 

Nous proposons maintenant une géné- 
ralisation de ce procédé : cette généralisa- 
tion n’a pas pour unique objet de généra- 
liser, elle prétend permettre d’aboutir à des 
méthodes plus efficaces que la méthode 
d’Euler. 

Dans P intervient une fonction et / un 
nombre X. Dans la méthode d’Euler, P w 
faisait intervenir la même fonction / et le 
même nombre X. Associons ici à f une 
fonction f n et à X un nombre X #J , et 
remplaçons le problème P par le problème 
P, r Pour le moment, f n est une fonction 
donnée, définie sur I X R, et dépendant 
du paramètre h. 

Considérons le problème P /f : Trouver 
Y„ = (>’o, y„) tel qu’on ait : 

y i+ 1 ==^/ + hf h (x it yi\ j> 0 = V 
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Faisons une étude de la convergence et 
essayons de choisir X h et f h pour que l’« or- 
dre de convergence » (cf. infra) soit bon. 

Consistance 

Nous dirons que le procédé P /? est consis- 
tant par rapport à P si : 

lim f h {x,y) =f(x,yl VxGl,Vy<ER. 

h -*o 

Cette condition est relativement simple 
à vérifier et assez intuitive : f h doit « res- 
sembler à f pour h suffisamment petit ». 
Par exemple, dans la méthode d’Euler, on 
avait f h = /’ pour tout /?, et cette méthode 
était donc trivialement consistante par 
rapport à P. 

S’il en est ainsi, on peut démontrer que, 
pour toute solution y de y — f(x, y ), on a, 
avec II — ajn, 


gênant, car, si X = tt par exemple, toute 
méthode numérique remplacera tt par 
À = 3,141 59... avec un nombre fini de 
décimales. Nous retrouverons évidem- 
ment cet ennui de résolution théorique 
dans la résolution numérique. Cela nous 
conduit à la définition suivante. 

Un procédé P/, défini par f h et X h est dit 
stable si, pour toute matrice triangulaire 
infinie (e /n ), 0 < / ^ n — 1 , telle que : 

lim max | z in j = 0, 

n— +*> 0 < / <$ n — 1 

il existe des constantes K, et K 2 telles que : 

max \y t — z { | 

< Ki |^o — | + K 2 max \t in \, 

0 < i — 1 

où y, et z h 0 < / < sont solutions de : 
y ,+ 1 + hfh(Xhy<)> 


lim max 

n — « 0 $ i ^ n — 1 



-y(Xi)] 


—fh{Xi,y{Xi)) 


= o. 


Remarquons que cette notion ne fait 
intervenir que les f h et non les X /f . 

Stabilité 

Considérons les deux problèmes définis 
par la même équation y' =/(v, y) et par 
les données initiales >’(.y 0 ) = X d’une part, 
et y(x 0 ) = X d’autre part. Supposons que 
(L) soit satisfaite. Les deux problèmes 
précédents possèdent respectivement une 
solution y et une solution y. Il peut arriver 
que, même lorsque | X — X | est faible, la 
quantité : 

max |j>(x) — y{x)\ 

xtl 

soit grande. C’est un phénomène d’insta- 
bilité du problème posé (indépendamment 
de toute méthode numérique de résolu- 
tion). Ce phénomène d’instabilité est très 


avec y 0 quelconque, et de : 

Z.-+1 =2,- + h\f H (x i ,y i ) + 

Cette condition de stabilité exprime le 
fait qu’une légère variation, sur les données 
initiales y 0 et z 0 d’une part, sur f h d’autre 
part, n’entraîne pas de grosses variations 
sur les résultats obtenus en résolvant P /r La 
condition de stabilité n’est pas simple. Voici 
une condition suffisante : le procédé P /? est 
stable s’il existe A > 0 tel que : 

!/*(*»«)— /*(*.*)! < a|«— v|, 

pour tous y El, u E R, y G R et 
h E [0, h 0 ] ; donc A est indépendant de v, 
y, v et h. Nous admettrons ce résultat. 

Convergence 

Considérons les problèmes P et P /? suivants : 
J>:y'=f(x,y),y(x 0 ) = K 

P h : y ,+ 1 =yt + Wh(x h yi),y o = x h , 

admettant pour solutions respectives les 
fonctions y E C*(I) et Y„ = 0 ; o> — >’»)■ 
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Nous dirons que le schéma P /; est conver- 
gent si : 

lim E„ = 0, 


où : 


= max 

0 < i < n 

Théorème fondamental de convergence. 
Si le schéma P A est stable d’une part, et 
consistant par rapport à P d’autre part, le 
schéma P,, est convergent, à condition 
que : 

lim \ h — X. 

A — 0 

En effet, comme P /; est consistant par 
rapport à P, on peut écrire : 

[v C* * + 1) — y( x î )] —fh(x h y(Xi)) = s in , 

où y est la solution de P et où : 

max | e in \ 

G < n — 1 

tend vers zéro lorsque n tend vers -f- °°- 
En posant z,- = v(x,), on a : 

z i+ 1 =z t - + h\ f k (x h Zi) + S, ■„], 

de sorte que, par la condition de stabilité, 
on obtient : 

E * = max |^/— y(Xj)\ 

0 ^ i ^ n 

< KjIX — À A | + M 2 max \e in \. 

0 </ ^ n — 1 

Si X;, tend vers X, on a : 

lim E„ — 0, 


Ordre d'une méthode 

Nous venons de voir que, si : 

lim f h (x,y) =f(x,y), 

A — 0 

\fh(x,u)—f h (x,v) \ < A|w — v|, 


alors, le procédé défini par f h est stable 
et consistant, donc convergent : cela 
prouve simplement que : 

lim E„ = 0, 

n —"O 

Nous dirons qu’une méthode est 
d’ordre p si on a E n < K h p lorsque X h = X. 
Des conditions pour qu’une méthode soit 
d’ordre p ont été données : elles font 
intervenir les dérivées par rapport à h de 
la fonction h >—* f h (x, y) = g(h). Les tech- 
niques utilisées sont relativement simples : 
il suffit de faire un usage fréquent de la 
formule de Taylor. Contentons-nous de 
donner certains résultats. 

Supposons que / est p fois continûment 
différentiable. Posons : 


nr or _ a3r 0 

*0-/, fl -Jï+f-fy 


et, de proche en proche, 
^T + i = "XT +/ _ sTT ’ 


à$k Mk 
âx J dy 

11 en résulte que, si y est solution de P, 
on a : 


y (k+ 'Kx) = £-J(x,y(x)) 

= &k(x,y(x)), 0 < k 

Pour que le procédé P /? soit d’ordre p , 
il suffit que : 


r d*g 1 , 

h ->q dh k k + 1 


0 < k < p — 1. 


La méthode du développement de Taylor 
consiste à prendre : 


fh(x,y) =f(x,y ) fr>y) 


h p ~ l ^ , 

■ + --J *p- \(x,y)-> 


on peut alors démontrer que E„ < K H\ 
Cette méthode est cependant assez difficile 
à utiliser car elle nécessite le calcul effectif 
des T k . 
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On peut aussi écrire : 

fh(x,y) = aj(x,y) 

+ a 2 f{x + a, h, y + a*hf(x,y)) 

et on cherche a 2 , a^ a 4 pour que la 
méthode soit d’ordre aussi élevé que pos- 
sible. En écrivant que : 

Ux,y) =f(x,y), 

on obtient les conditions a ] = 1 — a, 
cf 2 = a, ci ^ = a 4 — 1/(2 a). 

Pour a = 1/2, on a la méthode de 
Heurt : 

fh(*,y) =\\fi*>y) 4 -f{x + h, y + hf{x,y))\. 

Pour a = 1 , on a la méthode d Euler 
améliorée : 

fh(x>y) =f(x + y y + \f( x >y)\ 

Indiquons enfin la méthode de Runge et 
Kutta ; on pose : 

fh(x,y) = ^ [&, + 2k 2 -I- 2k, + fcj, 

avec : 

k 2 =f(?c + yy + \ k ù> 

k 3 =/(* + + **2). 

£4 = /(* + h, y + hk 3 ) ; 

cette méthode est d’ordre 4. 

Méthode 

des approximations successives 

On sait que le problème P est équivalent au 
problème Q : Trouver y continu sur I tel 
que : 

y(x) = À + f x f(î,y(t))dt. 

vx 0 


Si y est solution de Q, et donc de P, on a : 

y(x p +k)—y(x p ) = f Xp+k f(t,y(t))dt. 

0x p 

Supposons connues des valeurs appro- 
chées y p _ (r ..,y p de y(x p .. q \ ...,y(x p ). Nous 
connaissons alors des valeurs approchées 
de : f{Xp_p y(x (1 _j)), 0 < j < q. Posons : 

f p — j =f(x p _ jt y p _j) t 0 < j < q, 

et considérons le polynôme d’interpolation 
sur les points x p _ (/ , x p de la fonction 
t'-^f(t,y(t)) dont nous connaissons des 
valeurs approchées / /? 7 aux points x p p Le 
calcul approché de : 

\ Xp+k f{t y y{t))dt 

0x f 

peut se faire par une formule d’intégration 
de type ouvert, n’utilisant que les points 
précédant x p et le point x p . 

On a, par exemple, la formule appro- 
chée : 

y{x p+ ù—y{x p ) + J*' +i p (t)dt, 

où P désigne le polynôme d’interpolation 
sur les points x p x p . 

Considérons donc le schéma ou algo- 
rithme défini par la méthode d’intégration 
de Newton-Gregory : 

<? 

y p +\=yp + h 'y' c jWp, q <p — 1 , 

j = o 

où les différences régressives sont définies à 
partir de : 

Wk =fk—fk~i ; 

par récurrence : 

V 1 = V, VJfp = w-'fp - 

Ce schéma nous permet de calculer 
y p+ ! , pour p — q, puisque les V j f q sont 
connus ; y q + x étant connu, nous calculons 
y q+ 2 en changeant p en p + 1 et ainsi de 
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suite, en utilisant toujours le même nombre 
q 1 de points qui précèdent x p+ x . Le 
problème qui se pose est alors de savoir si 
les y p ainsi calculés sont proches des 
valeurs de la solution exacte. 

L’algorithme précédent est dit expli- 
cite ; car, à chaque étape, il définit une 
inconnue y p+x explicitement. La méthode 
suppose connues les valeurs de départ 
>’ 0 , ...,y q qui sont des valeurs approchées 
de Xx 0 ), y(x q ) et qui ont donc été 
obtenues par une autre méthode, par 
exemple une méthode à un pas, alors qu’ici 
nous obtenons y q+x par une méthode 
utilisant y 0 , ...,y q , et c’est pourquoi nous 
dirons que la méthode précédente est une 
méthode multipas, à q pas exactement. 

Remarquons que les c } peuvent être 
déterminés par la méthode de la fonction 
génératrice introduite à propos de l’inté- 
gration numérique par la méthode de 
Newton-Gregory. 

On peut aussi utiliser la méthode sui- 
vante. On calcule : 

de façon approchée par une formule de 
type fermé qui utilise donc y p+] que l’on 
cherche. Le schéma s’écrit : 

g 

y p + 1 = y p la ^ j ^ jf p + 1» 

J = o 

où les dj peuvent aussi être calculés par la 
méthode de la série génératrice. 

Cette équation s’écrit encore sous la 
forme : 

y pi i = ¥(xp+i,yj,+i) + k p> 

où K,, ne dépend que des point x p ... k , pour 

k > 0. 

On obtient donc y p +\ implicite- 
ment ; mais, p étant fixé, la détermination 
de y p + j peut être faite par itération : on 


prend la valeur y p+l obtenue par le 
schéma explicite et on itère en écrivant : 

y ( ;^ = hf(x p+u y^)yK p . 

La suite des y p ( + 1 , pour m — 0, 1, 2, 
3, converge vers la solution y p+l du 
schéma implicite lorsque A est suffisam- 
ment petit ; car, si on écrit le schéma impli- 
cite sous la forme y p+l = <£ 0 ^ +1 ), on a : 

$(w) — $(v) = h\f(x p+l ,u)—f(x p+ j, v)]. 

Donc on a la majoration : 

|<£(«) — $(v)| < hL\u — v| 

et la convergence est assurée si AL < 1 . 

La première méthode explicite permet 
de définir une première approximation de 
y q+ j : nous dirons que c’est une formule de 
prédiction. La deuxième méthode permet 
de modifier le résultat précédent et de 
l’améliorer : c’est une formule de correction. 

Ne cherchons pas à justifier a priori une 
méthode en utilisant un polynôme d’inter- 
polation ou un autre et écrivons brutale- 
ment un schéma multi-pas sous la forme 
générale suivante. 

On suppose que > ? 0 , y\,...,y q \ sont 
obtenus par une méthode à un pas conver- 
gente ; on écrit : 

g g 

« iy p -i = h (3 

1=0 1=0 

où les a, et p ; sont des constantes données, 
indépendantes de A, de p et de f 

Dans la suite, nous chercherons des 
valeurs des a, et des p, pour que la méthode 
soit aussi efficace que possible. Nous 
supposerons que a 0 9 ^ 0. 

Pour p = q , on obtient : 
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Si p 0 = 0, le système (S^) définit expli- 
citement y q par une formule du type : 

9 g 

y q ç — / “P h Qifq — 

i=l 1=1 

puisque >’ 0 , ..., ^ . , sont connus ; de proche 
en proche, on obtient y q , y q + ,, ...,y„ en 
calculant à chaque étape y q par une for- 
mule du type : 

où K^_, est connu. Si h est suffisamment 
petit, on démontre, comme précédem- 
ment, que l’équation précédente (en y q ) 
possède une solution unique qui peut 
être obtenue par itération ; il suffit en effet 
que : 



de proche en proche, on obtient y p , pour 
q < p < n, en résolvant chaque S^. 

On peut encore définir les notions de 
consistance (par rapport au problème 
posé) et de stabilité. Contentons-nous de 
donner certains résultats de convergence. 

Nous dirons que la méthode précédente 
est convergente si : 

E„ — max | y(x s ) — 

o ^ i < n 

tend vers 0 lorsque N augmente indéfini- 
ment. 

Cela suppose donc que les y h pour 
0 < i < q — 1, ont été définis par une 
méthode à un pas convergente. 

Considérons alors les polynômes : 

? 

A(z) = ^ a,zi-‘ , 

i = 0 
g 

B(z) — ^ fan-*. 

i = 0 


Ces polynômes A et B définissent la 
méthode multi-pas, puisque S p est défini 
par les a, et par les p,. 

Une condition suffisante de conver- 
gence est donnée par le théorème suivant. 

Théorème. Si A( 1 ) = 0 et si 
A'( 1 ) = B( 1), si de plus les racines z t de A 
satisfont à | | < 1 , pour 1 < / < q, et si 

les racines de module égal à 1 sont toutes 
simples, alors la méthode définie par les 
polynômes A et B est convergente. 

On peut obtenir aussi des conditions 
pour que la méthode soit d’ordre k. 
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DIOPHANTIENNES 

APPROXIMATIONS 

L a théorie des approximations diophan- 
tiennes concerne principalement 
l’approximation des irrationnels par des 
rationnels. Dans le cas d’un seul irration- 
nel, un rôle essentiel est joué par les 
fractions continuées (utilisées dès 1650 par 
Huygens pour le calcul des engrenages des 
horloges astronomiques). 
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L’approximation des irrationnels algé- 
briques fut étudiée par une méthode 
directe en 1844 par Liouville ; ses résultats 
furent améliorés à de nombreuses reprises 
jusqu’à l’important et définitif résultat de 
Roth en 1955. 

Dans le cas de plusieurs irrationnels, 
on peut soit chercher à approcher chacun 
d’eux par un rationnel, soit chercher à 
rendre minimale une forme linéaire à 
variables entières, à coefficients irration- 
nels (problème dual du précédent). Dans 
les deux cas, la théorie des réseaux de 
points (ou Z-modules, comme Z" par 
exemple) joue un grand rôle, avec la 
caractérisation de ses bases et le théorème 
fondamental de Minkowski sur les domai- 
nes convexes symétriques d’un réseau ; 
ce dernier théorème conduit principale- 
ment à la résolution en entiers d’inégalités 
à coefficients irrationnels, ce qui est aussi 
un problème d’approximation diophan- 
tienne. 

L’étude de la répartition modulo 1 a 
été également rattachée à cet article, 
étant encore, dans une certaine mesure, 
une question d’approximation diophan- 
tienne. 


1 . Z-modules et réseaux 

Un Z -module de R' 7 est un ensemble JC de 
points M de R 77 , de coordonnées {x\x 2 , 
X”), qui est sous-groupe additif de R' ! 
(donc, s’il contient M' et M", il contient 
i/M' + vM" pour tout u et v de Z). On 
appelle base de JC un ensemble A,, A 2 , 

A,, d’éléments de JC, tel que tout élément 
de JC s’écrit, d’une manière unique, sous 
la forme a 1 A, + « 2 A 2 -b ... + a' A,., où 
tf'E Z. On remarquera qu’on peut avoir 


r > n (par exemple dans R avec les 
nombres de la forme a b Vï , où a et b 
sont entiers, on a r = 2 pour /? = 1 ). 

Lorsque chaque point de JC est isolé 
dans R 7 ', c’est-à-dire est centre d’une boule 
ne contenant pas d’autre point de JC, le 
Z-module est dit discret ; cette propriété est 
évidemment caractérisée par le fait qu’il 
existe une boule de R 77 , de centre O, qui ne 
contient que O comme point de JC. On 
appelle réseau tout Z-module discret et on 
démontre qu’un réseau de R 77 ne peut avoir 
de base comprenant plus de n éléments. 
Plus précisément, si un réseau admet une 
base de r éléments, l’espace vectoriel qu’il 
engendre est de dimension r. 

Pour n = 1 , tout réseau est donné par 
v __ m X{) où m G Z et x 0 = inf | x | pour 
.y E JC — { O } ; en effet, JC étant discret, 
x 0 existe bien, est non nul et appartient à 
JC, et tout x de JC en est multiple, sans quoi 
le reste du quotient de | x \ par x 0 contre- 
dirait l’hypothèse faite sur x 0 . Pour n 
quelconque, la démonstration de r < n se 
fait par récurrence en projetant sur R 77_I 
parallèlement à l’un des vecteurs OA,-. 

On supposera, sans rien restreindre 
dans ce qui suit, que les réseaux envisagés 
correspondent à r = n. Un exemple fon- 
damental est celui des points à coordon- 
nées entières de R", auquel on peut tou- 
jours se ramener dès qu’on a une base A,, 
A 2 , ..., A„ du réseau : c’est Z 77 . 

11 est important de pouvoir caractériser 
les bases de Z 77 ; on démontre qu’une 
condition nécessaire et suffisante pour que 
n points A b A 2 , A„ de Z 77 forment une 
base de ce réseau est que le déterminant de 
leurs coordonnées soit égal à ± 1. Dans le 
cas de n = 2, si (p x , q { ) et (p 2 , qi) sont l es 
coordonnées de A } et A 2 , on doit donc 
avoir, pour une base, = ± U 

c’est-à-dire que les deux fractions pjq j et 
p 2 /qi sont adjacentes . 
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On remarque enfin que OAjA 2 forment 
base de Z 2 si, et seuleme nt si, l e par allé- 
logramme construit sur OA,, OA 2 ne 
contient aucun point du réseau en son 
intérieur ; il a alors pour surface 1, et cela 
se généralise à Z". 

Un important théorème de Minkowski, 
sur les réseaux, sera vu plus loin. 

2. Approximations 

d'un irrationnel. 

Fractions continuées 

Dans le plan affi ne d'axes Ox, O y, de 
vecteurs de base OA, OB, soit la demi- 
droite (OD) d’équation x = tv, avec 
y >0 et r G R. Approcher r par des 
rationnels pjq (avec q > 0) revient à 
approcher 

(OD) pa r des points du réseau de base 
OA, OB. Un point P (p, q) de ce réseau est 
un point de voisinage à droite pour (OD) 
si pjq > r et 0 < pjq — T < pjq — t 
entraîne q' > q . Même définition à gauche 
avec r > pjq et 0 < r—p'/q' < r—pjq. 
Un point P (/?, q) est un point réduit , 
relativement à (OD), si \p' — r q' \ 
< | P — T q | entraîne q > q . 

Si t est rationnel, soit t = u/v, la 
demi-droite (OD) porte le point entier 
P (u, v ) et il n’y a plus, au-delà de P, ni de 
point de voisinage, ni de point réduit pour 
(OD). Les points antérieurs à P sont 
donnés par le théorème suivant, qui 
s’applique sans limitation lorsque r est 
irrationnel : Si P /f A . et P„ A+1 sont deux 
points de voisinage consécutifs (pour q 
croissant), d’un même côté de (OD), alors : 

a) La d emi-droite portant le vecteur 
P„ A P, u+1 rencontre (OD) en un point 
D„+ 2 (non entier ). 

b ) = h p n.k Kk+I donne, 
pour h = 1,2, ..., les points de voisinage 


suivant P„ A , du même côté de (OD), 
jusqu’au dernier avant D, ;+2 , soit P, J+2 . 
Ces p oints so nt adjace nts deux à deux. 

c) OP„+ i = P, g- P;t, A-+i et 

p «+ 2 Ï\+u = P*.jt donnent deux 

points de voisinages consécutifs, P, ?+1 et 
P„ +u , de l’autre côté de (OD), ce qui 
permet de poursuivre l’opération et d’obte- 
nir tous les points de voisinage au-delà de 
P n k , sur deux lignes polygonales appelées 
lignes polygonales de Klein relatives à 
(OD) ; ces lignes forment enveloppe 
convexe des points entiers situés de part et 
d’autre de (OD). 

d) Seuls les sommets P„ de ces lignes 
polygonales sont des points réduits. 

Ce théorème s’établit par des considé- 
rations géométriqu es très é lémen taires. O n 
pose e n gé néral P „_ 2 D„ = a„ OP„ j et 
p„ 2 P „ = OP„ , ; donc a„ = [a„], par- 
tie entière de a„. La similitude des triangles 
OP /; D /; et D /î+1 P rt } 0 donne alors 
0^+1 = 1 /(a n — a„) et l’on obtient ainsi, 
géométriquement, le développement en 
fraction continuée (régulière) de r : 

1 1 

T — ûf 0 -{- ~ ~ ’ «1 = «I +—»“■• 

a l a 2 

1 

a n = a n + 

a n + 1 

avec a 0 = [r] et a n = [aj. Les a„ sont les 
quotients complets du développement et les 
a tv les quotients incomplets . 

On écrit alors t= [ a 0 , a h ..., a n _ { , aj 
et p„lq n = [a 0 , .... a„], n-nième 

réduite (qui correspond au point P„), 
d’où : 

[ Pn =Pn-l + <lnPn-X 
l 9* = 9n- 2 + a n qn- U 

ce qui exprime que P„ 2 P# 7 = OP„ i- 
C’est grâce à ces formules de récurrence 
qu’on calcule les p n et les q n connaissant les 
a k . 
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Les résultats essentiels de la théorie de 
ces fractions continuées sont les suivants : 
( 1 ) On a : 

T P*= (- 1 )* 

q n q n {q n -\ + <*n + iq„) 

ce qui montre que l’approximation de r 
par une réduite est d’autant meilleure que 
a, I+ | est grand. 

Par exemple it = [3, 7, 15, 1, 292, 1,1, 
1, ...] donne une excellente approximation 
classique p 2 /q 2 = 355/113. 

(2) Une condition nécessaire et suffisante 
pour que deux irrationnels r et a présen- 
tent, à partir de certains indices, les mêmes 
développements, est qu’ils soient liés 
par une transformation homographique 
modulaire , c’est-à-dire o — (a r + b)/ 
(c t + d) avec ad—bc — ± 1 et a , b , c et 
d entiers. 

(3) Une condition nécessaire et suffisante 
pour que r présente un développement 
périodique est que r soit un irrationnel 
algébrique du second degré (théorème dû 
à Lagrange). 

(4) | T — p n /q n \ < i /q* 2 , 
pour tout n. 

Sur deux réduites consécutives, l’une au 
moins vérifie : 

\T-Pn/q n \< l/(2?„ 2 ). 

Sur trois réduites consécutives, l’une au 
moins vérifie : 

|t— P „/ q n \< 1/(V5 q n >). 

(5) Si |r — u/y | < 1/(2 v 2 ), 

u/v est une réduite du développement de r. 

(6) Si on développe le rationnel a/b en 
fraction continuée et si ajb — pjq n , la 
réduite précédente (Aj-i)/(<7«-i) fournit 
une solution de l’équation de Bezout : 

ax — by ~ ± 1 . 


(7) Si l’irrationnel VJ ( d entier > 2) est 
développé en fraction continue, on a : 

Vd = [a Q ,a u a 2 a„_ lt 2a 6 ], 

périodique à partir de a u période de n 
termes, avec a x = a n _ u a 2 = a n _ 2 , ... (cela 
caractérise les développements de VJ). 

Si n est pair , les solutions de l’équation 
de Pell x 2 — dy 2 = 1 sont données par 
x = p kn - 1 , y = q k „ -h pour k= 1,2, 3, ... 
et x 2 — dy 2 = — 1 n’a pas de solution. 

Si n est impair les formules précédentes 
donnent : pour k — 1, 3, 5, 7, ..., les 
solutions de x 2 — dy 2 — — 1 , et, pour 
k = 2, 4, 6, ..., les solutions de 

x 2 — dy 2 = 1 . Par exemple x 2 — 13 y 2 — 1 
conduit à : 

VÏ3 = [3, 1, 1, 1, 1, 6], 

d’où 649/180 pour k —2, donnant la plus 
petite solution x = 649, y = 1 80 qu’il 
était difficile de trouver par essais succes- 
sifs. 

Ces résultats s’établissent à partir de la 
formule : 

T = Pn- 2 + <*nPn-l 

q n _\ + ’ 

relation modulaire liant r et a n et expri- 
mant que D /7 est sur (OD). On en tire en 
effet aussitôt la formule de ( 1 ) et le résultat 
de (2), qui, géométriquement, signifie qu’à 
partir d’une autre base du réseau Z" les 
points de voisinage et les points réduits 
sont, assez loin, les mêmes qu’à partir de 
la base OA, OB ; cela en raison du 
caractère géométrique intrinsèque des 
lignes polygonales de Klein. La condition 
nécessaire de (3) est évidente (a* — a A . +T 
donne a k lié homographiquement - et 
même modulairement - à lui-même, donc 
racine d’une équation du second degré ; il 
en est de même pour r). Sachant que t est 
irrationnel du second degré, on peut 
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démontrer la condition suffisante. Algé- 
briquement, en utilisant les équations 
du second degré que vérifient les ot„, 
équations à discriminant constant (ce 
qui permet, compte tenu de leurs signes, 
d’en limiter les coefficients ; d’où répéti- 
tion et période). On peut aussi le démon- 
trer géométriquement, à partir de la 
rotation hyperbolique. Cette transforma- 
tion consiste à associer à (OD) la demi- 
droite (OD') correspondant au conjugué t' 
de r et à remarquer que l’affinité d’axes 
(OD) et (OD'), et de multiplicateurs 
respectifs v' et v, où v est une unité de Q[t] 
de la forme u -f- c 2 v r (u et v entiers, c 2 
coefficient du premier terme de l’équation 
définissant t), conserve le réseau Z 2 et, par 
conséquent, fait « glisser » sur elles- 
mêmes, à partir d’un point suffisamment 
éloigné, les lignes polygonales de Klein 
relatives à (OD). Il y a donc période (et 
période dès le début si t > 1 et 
- 1 < r' < 0). 

Les propriétés de (4) s’établissent en 
posant : 


l 


?»?!»+ 1 




et en montrant que X n ou X w _j est infé- 
rieur à 1/V3\ ce qui donne le résultat, 
grâce à : 

1 

4«Çn+l 


— — T 

+ 


?» 


q n + 1 


La propriété (5) est évidente géométri- 
quement, en considérant les parallélo- 
grammes centrés en O, de côtés parallèles 
aux axes et dont un sommet est un point 
réduit. 

La propriété (6) n’est autre que la 
récurrence fondamentale : 

Pn-\q n —Pn<ln-\ = ( “ !)"■ 


La propriété (7) est plus délicate à 
établir par le calcul ; l’étude de 

a„ = (b n + VD )/c n 
conduit en effet à : 

= [VD] + VD 

et permet de conclure p 2 — q 1 D = 
( — 1 ) km pour la réduite d’ordre (km — 1). 
Reste à montrer qu’on a là toutes les 
solutions. 

Signalons d’autre part que la propriété 
(2), qui n’est plus vraie lorsque la trans- 
formation n’est pas modulaire, est rempla- 
cée, lorsque ad — be — m > 2 par des 
formules assez simples de transformation 
des quotients incomplets, à condition que 
ceux-ci soient périodiques modulo m. C’est 
ainsi que le développement de 

= [2, 6, 10 2 (2 n + 1), ...] 

e — 1 

se transforme en : 

e = [ 2 , 1 , 2 , 1 , 1 , 4 , 1 , 1 , 6 , 1 , 1 , ..., 2 n, 1 , 1 , ...]. 

Pour obtenir le développement de 
(e + l)/0? — 1), Gauss a utilisé le dévelop- 
pement en fraction continuée non régu- 
lière des séries hypergéométriques. 


3. Approximations 

des irrationnels algébriques 

On dit qu’un irrationnel t est rationnelle- 
ment approchable à l’ordre a s’il existe une 
constante dépendant de t, soit K(t), telle 
que : 

l T — p/q\ < K(r)/ç a 

ait une infinité de solutions. 

On voit sans peine qu’un rationnel u/v 
est approchable à l’ordre 1 et pas au-delà. 
D’autre part, les propriétés des fractions 
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continuées montrent que tout irrationnel 
est approchable à l’ordre 2 au moins et 
qu’un irrationnel quadratique est appro- 
chable à l’ordre 2 et pas au-delà (à cause 
de la périodicité du développement). Ce 
dernier résultat est un cas particulier du 
théorème de Liouville (1844) relatif aux 
irrationnels algébriques de degré n: si r est 
de degré /?, il n’est pas approchable à un 
ordre supérieur strictement à n. En effet, 
si f (r) = 0, où /est le polynôme de degré 
n définissant r, l’étude de : 

/ (^)_ /(T) = (j_ T ) /w 

donne élémentairement : 


exemple que le développement décimal 
lacunaire .y — 10 -1 -b 10 3 + 10"' 9 + ... 
+ 10 -3 " + ... représente un nombre trans- 
cendant. 

La recherche, pour un nombre algébri- 
que r, de la plus petite constante /c(t), pour 
laquelle : 



a une infinité de solutions, est alors inté- 
ressante. Le nombre dor : 

a = i(V5—l) = [1,1,1,...] 

a pour réduites les fractions de Fibonacci : 

1 1 2 3 5 s 13 
T ’ 2 ’ 3 * 5 ’ 8 ’ 13 ’ 21 ’’ 


pour tout rationnel pjq . 

Le théorème de Liouville a une grande 
importance historique, puisqu’il a permis 
de définir explicitement les premiers nom- 
bres transcendants (nombres de Liouville), 
grâce à des développements (décimaux ou 
en fraction continuée) lacunaires tels que : 

* = io— 11 4- l0- 2! + ... + l0-« ! 4- ... 

OU : X — [0,10 1! , 10 2! ..., 10" ! ,...] ; 

jusque-là on ne connaissait que l’existence 
des nombres transcendants (par complé- 
mentarité dans R des nombres algébri- 
ques) et ce n’est qu’en 1873 que Hermite 
établit la transcendance de e , permettant à 
Lindemann d’établir celle de tt en 1882. 

Le résultat de Liouville a été successi- 
vement amélioré par Thue (1908), établis- 
sant a ^ (n/2) + 1, par Siegel (1921) 
a < 2 par Dyson (1947) a < VJ n , 
et, en 1955, à l’aide d’une démonstration 
très technique, Roth améliorait définitive- 
ment le théorème : Tout irrationnel algébri- 
que r est approchable à l’ordre 2 et pas 
au-delà. Cela permet d’affirmer par 


et on voit aisément que : 




ce qui montre que k(a) = l/V? (résultat 
de Hurwitz). 

Mais, si l’on excepte le nombre a et 
ceux qui lui sont équivalents par transfor- 
mation modulaire, on peut établir que : 

*( t ) < 1/(2 V 2 ). 

Cela rejoint d’ailleurs les chaînes de 
Markoff-Hurwitz, qui, pour les irration- 
nels r, étudient la limite supérieure M(r) 
des constantes c telles que | r — (/?/ 
q) | = 1 j{cq 2 ) ; on obtient M(r) = V / 5 
pour le nombre d’or et ses équivalents, puis 
M(r) > 2 VJ pour les autres irrationnels, 
avec M(r) — 2 VJ pour r équivalent à 
1 + VJ, puis M(r) > VJ2T/5 pour les 
autres irrationnels, et ainsi de suite, les 
valeurs successives de M(t) apparaissant 
étant données par la formule : 

M(t) = V9 — 4/« 2 , 
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où u = 1, 2, 5, 13, 29, ... est choisi de telle 
sorte que u 1 + v 2 + w 2 — 3 uvw soit réso- 
luble en entiers. 

Citons encore deux résultats sur les 
approximations asymétriques. Ségré éta- 
blit, en 1946, que, pour tout r > 0 et pour 
tout irrationnel t, il existe une infinité 
d’approximations pjq telles que : 

— 11/7 rl 

— — < — — r < ■ - — — ; 

VI + 4 r q 2 q Vl + 4r q 2 

le cas r — 0 donne la propriété (4) des 
fractions continuées et le cas r — 1 donne 
le résultat de Hurwitz. Robinson établit 
en 1947 que, pour tout s > 0 et pour 
tout irrationnel r, il existe une infinité 
d’approximations p/q telles que : 

— 1 1 r 1 , 

V5 — e) q 2 q T < V5 + 1 ) q 2 ’ 

cela montre qu’on peut renforcer une des 
inégalités du théorème d’Hurwitz sans 
affaiblir beaucoup l’autre. 

4. Approximations simultanées 

Étant donné k irrationnels Tj, t 2 , r A „ on 
peut soit chercher à les approcher par des 
fractions p x /r, p 2 /t\ ..., p k /r de même 
dénominateur (pas obligatoirement toutes 
irréductibles), soit chercher à rendre 

u 1 T 1 + « 2 T 2 + + u k r k — w 

minimum pour des entiers u, et u\ Ces deux 
problèmes duals l’un de l’autre sont éga- 
lement délicats. Le premier problème a été 
étudié initialement par Hermite, le second 
par Dirichlet. Une variante non homogène 
du deuxième problème consiste à rendre 

U \T l + u 2 t 2 + ... + u k T k — o~~w 

minimum, a étant donné non entier. 

Un algorithme de Jacobi généralise 
pour les irrationnels l’algorithme des frac- 


tions continuées. Il correspond, pour 

k = 2, à : 


1 = + 

où a„ = [<x„] et b„ — [P„], avec « 0 = [t] et 

K = W- 

Cela, géométriquement, ramène le pre- 
mier problème d’approximation simulta- 
née à l’exploration des points de Z? autour 
de la demi-droite (OD) portant le vecteur 
de composantes (r, a, 1 ). On obtient une 
suite de points liés par l a ré currenc e 
OP„ = OP w 3 + ^fjOPff 2 + (7 /70P / , J 
et beaucoup de formules généralisent ce 
qui a été vu pour les fractions continuées. 
Malheureusement, si la convergence des 
réduites peut s’établir d’une manière géné- 
rale, | p — t r | et \q — o r \ ne tendent pas 
toujours vers zéro. D’autre part, si on veut 
essayer de définir des points de voisinage, 
on doit tenir compte simultanément de 
\j — p/r\ et | o — q/r |, ce qui peut se faire 
par leur borne supérieure, leur somme, la 
somme de leurs carrés, et bien d’autres 
manières qui ne sont pas équivalentes 
entre elles. C’est pourquoi Hermite a pu 
dire que ce problème n’avait cessé, durant 
cinquante ans, de le préoccuper et de le 
désespérer. 

Lorsqu’un développement de Jacobi 
pour k = 2 est périodique, il est facile de 
voir que r et a sont deux éléments, non liés 
linéairement, d’un même corps cubique. 
La réciproque n’a pu être établie jusqu’à 
présent. Tout au plus peut-on dire, avec 
David (1956), que pour certains algorith- 
mes voisins (où l’on prend par exemple 
a n = a n+x ou b f n = b n + 1) cette récipro- 
que est inexacte. Il n’en reste pas moins 
que d’intéressants résultats ont été obtenus 
par Perron grâce à l’algorithme de Jacobi, 
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sur l’approximation de n entiers algébri- 
ques d’un corps de degré (n + 1). 

Indépendamment de tout algorithme et 
par une simple application du « principe 
des tiroirs » de Dirichlet (Si n + 1 objets 
sont dans n tiroirs, l’un au moins de ces 
tiroirs contient plus d’un objet) on démon- 
tre qu’il y a au moins une solution au 
système \j i —p i /r\ < l/r 1+ç , où £ = 1 jk. 
Ce résultat de Kronecker est sans grand 
intérêt dès que k dépasse 3. Par dualité, on 
en déduit que : 

|«lTl + u 2 t 2 + ... + U k T k — y | < \/t k 

a des solutions entières w, et y\ non toutes 
nulles, avec sup | «,■ | = /. 

Une étude plus précise de Khintchine 
lie l’indice coj de w,t, + u 2 t 2 -j- ... 
H- u k T k — y (c’est-à-dire la borne supé- 
rieure des co tels que cette forme soit 
approchable à 1 près) à l’indice co 2 des 
k nombres t, (c’est-à-dire la borne supé- 
rieure des co tels que chaque t,- soit 
approchable à près). 

On a : 

Le cas non homogène (étude de 
| r p — q — g |, ou, plus généralement, de 
I T ] u l + T 2 u 2 + ... 4- T k u k ~ H* - g I ) a 
permis à Tchebycheff, Kintchine, Kronec- 
ker, Hermite et Minkowski d’obtenir des 
résultats analogues à ceux du cas homo- 
gène. 

Signalons enfin d’intéressantes études 
sur l’approximation d’un nombre complexe 
a -f- /|3 par le quotient P/Q de deux entiers 
de Gauss (Hermite, en liaison avec les for- 
mes quadratiques, Minkowski, Perron, 
Hurwitz en particulier). Un résultat essen- 
tiel est qu’il y a une infinité de solutions à 

|cx -4-/(3 — (P/Q)[ < l/(V3|Q| 2 ). 


Le théorème de Thue-Siegel-Dyson- 
Roth sur l’approximation d’un irrationnel 
algébrique a été généralisé au cas de 
plusieurs irrationnels algébriques, en 1970, 
par W. Schmidt. Ainsi, pour r ( , ..., r„ des 
nombres algébriques tels qu’aucune com- 
binaison linéaire a l T l + ... + a n r n , avec 
a x , ..., a n rationnels non tous nuis, ne soit 
un nombre rationnel, et pour e réel positif 
arbitraire, il n’y a qu’un nombre fini 
d’entiers p l9 q (q > 0) satisfaisant : 

I T i —p i/q | < l/g 1 + Un+E . 

Plus généralement, désignant par || x || la dis- 
tance d ’un réel x au plus proche entier, pour 
T b ..., r„ et e comme ci-dessus, il n’y a qu’un 
nombre fini d’entiers positifs q tels que : 

q l+t \q*\ Il - \\q^ n II < b 

et il n’y a qu’un nombre fini d’entiers 
q h ..., q n non nuis tels que : 

lîi -?«| i + e II?iTi + ... + q„T„ | < 1. 


5. Théorème de Minkowski 
et applications 

Dans sa Géométrie des nombres , Min- 
kowski établit en 1910 l’important théo- 
rème : Soit dans R /J un domaine S convexe, 
borné, symétrique par rapport à O et de 
volume supérieur à 2" (ou égal à 2 n si ce 
domaine est fermé). Ce domaine contient 
au moins un point entier distinct de O (il 
contient donc aussi son symétrique par 
rapport à O). 

La démonstration utilise l’homothéti- 
que S' de S dans l’homothétie (0, 1/2). 
Pour un entier m assez grand, soit le 
réseau (Z jnif des points de coordonnées 
Xj = ujm où UjÇE Z. Soit N(/u) le nombre 
d’hypercubes de côtés l/m de ce réseau 
qui sont dans S'. On a N (m) X nf aussi 
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voisin qu’on veut de 1/2” . V(S) pour m 
assez grand et cela permet d’affirmer 
l’existence de deux sommets où les u- et 
u" sont congrus modulo m , pour i = 1,2, 
..., n. Le vecteur joignant ces deux som- 
mets est donc un point entier, car 
(u' — u" )/m est entier, qui appartient à 
S' + S' = S. 

L’application essentielle de ce théorème 
concerne la résolution des systèmes d’iné- 
quations diophantiennes : 

loq 1 *! + a?x 2 + ... -f apx H | ^ À,-, 

pour /= 1, 2, ..., n, où les sont 
réels donnés, ainsi que les À„ et dont on 
cherche des solutions entières non bana- 
les (Xj entiers non tous nuis). Ces inéqua- 
tions définissent une jauge de Minkowski 
(c’est ainsi qu’on appelle les domaines S 
définis ci-dessus) dont le volume est 
2" À j À 2 ... XJ | À |, où A est le déterminant 
des a{. On peut donc affirmer que, si 
Àj À 2 ... À„ > | A |, il y a des solutions 
entières, autres que le point O, au système 
des n inéquations. En particulier, on 
retrouve le résultat de Kronecker : le 
système de n inéquations 

\^i—Pi/r \ ^ 1/C 1+E ) 

est résoluble pour e = 1/n ; en effet, cela 
s'écrit : 

k*,— pA < (i/^ £ ) 

M < r 9 

système de (n -f- 1 ) inéquations résoluble 
puisque la condition de Minkowski est ici 
réalisée : 

(1 /r*) n X r = 1, si 8 = \/n. 

On peut d’ailleurs, si les aj sont entiers, 
appliquer ces résultats à des systèmes 
d’équations linéaires, car : 

U; l x i + ... 4- Ui n x n = 0 


équivaut à : 

\Ui l x x h - ... + u?x n | < \ < 1 , 

si les uj sont entiers et si l’on cherche à 
résoudre en entiers x r 

Le théorème de Minkowski s’étend de 
plus au cas complexe, à condition que les 
inéquations du système soient réelles ou 
imaginaires conjuguées 2 à 2 (avec alors le 
même A ; pour ces deux inéquations). Il 
vient encore la condition À, À 2 ... X /7 > J A |, 
suffisante pour entraîner l’existence de 
solutions entières autres que le point O. 
C’est sous cette forme que le théorème 
permet la démonstration d’un important 
théorème de Dirichlet sur l’existence des 
unités dans une extension algébrique de Q. 

On peut aussi appliquer le théorème des 
jauges de Minkowski en définissant 
celles-ci par : 

|L 1 | + |L 2 | + ...+|L„|<À 

où L ,• = oqLvj -f- a f ”x n . On démontre 

ainsi que les deux inéquations : 

I Im | + 1 1^ | + ... + | L„ | < (n ! | A | ) 1/B 

et | L t L 2 ... L„ | < " n\ | A| 

ont l’une et l’autre des solutions non 
banales, car : 

n I Lï L 2 ... L„ | 1/ffl < | Lj | + | L, | + ... + | L„ | . 

On peut toutefois noter que, contrai- 
rement au cas des inéquations, où 
la condition j Aj À 2 ... À„ | ^ | A | ne peut 
être améliorée d’une manière générale, 
on peut parfois améliorer les résultats 
ci-dessus. Par exemple, pour n = 2, 
on peut affirmer que l’inéquation 
| Lj L 2 1 < | A | VJ admet toujours des solu- 
tions non banales. 

La réduction des formes quadratiques 
utilise aussi le théorème de Minkowski. 
applique à Lj~ d— L 2 ~ —f- ... — L L /? “. 
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Blichfeldt (1914) a étendu à d’autres 
domaines que des jauges les méthodes 
de Minkowski ; ces recherches ont été 
poursuivies par Mordell, Davenport et 
Mahler. 


6. Répartition modulo 1 

Quoiqu’il ne s’agisse pas à proprement 
parler d’approximation diophantienne, on 
peut ranger dans cet article l’étude des 
suites de nombres réels, modulo 1 . Il s’agit, 
pour une suite ( u n ), de la répartition sur 
[0, 1[ de {u n } — u n — [u n ] où [ u n ] est la 
partie entière de u n . 

Ce n’est qu’en 1884 que Kronecker 
établit que, si 0 est irrationnel, ses multi- 
ples «0 sont, modulo 1 , partout denses sur 
[0, 1[. Cela signifie que, quel que soit 
X G [0, 1 [ et quel que soit e > 0, il existe 
une infinité de valeurs de n pour lesquelles 
| {«0} — A'| < e. En effet, {^0} est diffé- 
rent de {/? 2 0} si n x ^ n 2 ; il existe donc au 
moins un point d’accumulation des nom- 
bres («0), c’est-à-dire qu’on peut trouver n x 
et n 2 avec {n x — n 2 ) 0 £= ]0, e[, d’où les 
multiples m(n x — n 2 )0 qui fournissent des 
points, modulo 1 , à moins de e de tout a 
de [0, 1[. 

On remarquera que le problème de la 
répartition sur un cercle des points d’abs- 
cisse curviligne nQ conduit au même résul- 
tat si 0 est incommensurable à tt (ici on 
raisonne modulo 2 tt). De même, par 
exemple, l’étude des premiers chiffres du 
nombre 2", écrit en base 10, conduit à 
étudier la mantisse de n log 2, c’est-à-dire 
sa répartition modulo 1 . Comme log 2 est 
irrationnel, puisque 10^ ^ 2, on en 
déduit qu’on peut toujours trouver une 
infinité de valeurs de n telles que 2" 
commence par k chiffres quelconques 
imposés. 


La notion d' équirépartition fut mise au 
point par Weyl en 1916. La suite ( u n ) est 
dite équirépartie modulo 1 si les {«„} sont 
denses sur [0, 1] et si, de plus, pour tout 
[a, P] C[0, 1] le nombre cp N (a, P) d’indices 
n pour lesquels n < N et E [a, P] 
vérifie : 

qp N /N — ’ ► |3 — a quand N — -j- °° ; 

une condition suffisante pour que la suite 
{f («)) soit dense sur [0, 1 [ est que : 

/(*)-+ « et f{x + l)-/(*)-0 

quand * — *• + 00 ; 

c’est ainsi que la suite (0 Log"«) est 
dense sur [0, 1 [ modulo 1 , quel que soit le 
nombre réel 0 non nul et le nombre réel 
a > 1. 

Dès 1912, Bohl, Sierpinski et Weyl 
établissent l’équirépartition de (/?0) pour 0 
irrationnel cependant que Fejer donne des 
conditions suffisantes d’équirépartition ou 
de non-équirépartition : Si / est strictement 
croissante, à dérivée continue monotone, 
avec f(x) — + », /'(*)— 0, xf (x) — oo 
quand x — > + oo, il y a équirépartition. Si 
au contraire xf(x) —* 0, il n’y a pas équi- 
répartition. On en déduit les résultats 
concernant (0 Log a n) (équirépartition si 
a > 1, non-équirépartition si a ^ 1). En 
1916, Weyl énonce le critère d’équirépar- 
tition : celle-ci est caractérisée, pour une 
suite / («), par le fait que, pour tout entier 
h non nul, 

n 

exp 2 i tt hf(k) 

k = i 

est un o(«) pour n — ► oo. 

Plus tard (1933), Koksma établit que la 
suite À f\ où À est réel non nul fixé, est 
équirépartie modulo 1 pour presque tous 
les t > 1 (mais on ne connaît aucun t pour 
lequel on ait établi cette équirépartition ; 


260 



DIOPHANTIENNES équations 


on pense par exemple que (3/2)" est 
équiréparti modulo 1, mais on n’a pas pu 
le démontrer jusqu’ici). En revanche, une 
catégorie importante de nombres algébri- 
ques échappe à cette équirépartition : 
il s’agit des nombres de Pisot- 
Vijayaragavan, qui sont des entiers algé- 
briques 0 tels que 0 > 1 , les conjugués 0„ 
pour i — 2, 3, ..., s (s est le degré de 0), 
étant tous en modules inférieurs à 1. Il 
s’ensuit que 0" converge vers zéro modulo 
1 (raisonner sur 0" -f- 0" 2 4- ... + 0” qui 
est un entier). Salem a démontré en 1944 
que l’ensemble S des nombres de Pisot 
était fermé. 

MARCEL DAVID 
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DIOPHANTIENNES équations 

D iophante d’Alexandrie, vers les 
années 250 de notre ère, fut le 
premier à rechercher systématiquement les 
solutions en nombres entiers, ou ration- 
nels, d’une équation ou d’un système 
d’équations polynomiales à coefficients 
entiers. Bien que ce ne soit qu’avec Fermât 


(1601-1665) que les méthodes utilisées 
pour résoudre ces équations prirent un 
aspect vraiment arithmétique, c’est-à-dire 
faisant pleinement intervenir la factorisa- 
tion des nombres entiers, une longue 
tradition appelle équation diophantienne 
la donnée d’un système d’équations poly- 
nomiales à coefficients entiers : 

/i(*i. «••>*«) = 0 

/ f C*i, -o, 

à résoudre en nombre entiers, ou ration- 
nels, x { , ..., x n . 

Selon que l’on veut résoudre en nombre 
entiers ou rationnels, les méthodes et les 
résultats diffèrent souvent sensiblement. 

Des méthodes générales existent pour 
résoudre un système d’équations du pre- 
mier degré, ou encore une équation du 
second degré. On dispose encore de métho- 
des pour étudier une équation du troisième 
degré, mais déjà, là, les problèmes ouverts 
abondent. Quant aux équations de degré 
supérieur, il est significatif que beaucoup 
d’ouvrages consacrés aux équations dio- 
phantiennes n’apparaissent que comme 
une accumulation de résultats disparates. 

De fait, il a maintenant été établi 
(J. Robinson, Yu. V. Matijasevic, 1970) 
que le dixième problème de Hilbert a une 
réponse négative : il n’existe pas d’algo- 
rithme universel permettant de décider si 
une équation diophantienne a une solution 
en nombre entiers. 

On ne peut donc espérer obtenir des 
méthodes générales que pour des types 
particuliers de systèmes d’équations. Com- 
ment classifier ces « types » ? La façon la 
plus évidente est d’utiliser le degré des 
équations définissant le système. Cette 
classification est souvent trop grossière, 
mais peut être affinée grâce à la géométrie 
algébrique. Cette dernière permet d’obte- 
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nir des résultats généraux parfois diffi- 
ciles à traduire en termes d’équations 
concrètes. La géométrie algébrique nous 
donne aussi la mesure de notre ignorance : 
ainsi aucun changement de variables ne 
permet de ramener une équation du type : 

ax 1 * * * 5 + by 5 + cz 5 + d = 0 

(a, b , c, d entiers non nuis), à résoudre en 
(.v, j', r) nombres rationnels, à un type 
d’équations que l’on sait actuellement 
traiter. 

Par extension, on appelle aussi équa- 
tions diophantiennes des équations dans 
lesquelles les exposants figurent parmi les 
inconnues ; la plus fameuse équation de ce 
type est : 

x m — yn = 

à résoudre en entiers (.v, y, m , n) au moins 
égaux à 1, qui n’admettrait (E. Catalan, 
18 14-1 894) que la solution : 

3 2 — 2 3 = i. 

De grands progrès ont été réalisés dans 
cette direction. 

Dans cet article, l’ensemble des entiers 
naturels est désigné par N, l’anneau des 
entiers relatifs par Z. le corps des nombres 
rationnels par Q. 

fa 


1 . Le premier et le second degré 

Le premier degré 
L’équation : 

QX + by = C , 

ou ci, b , c sont entiers relatifs, se traite 

classiquement, 


Si c n’est pas divisible par le plus grand 
commun diviseur de a et b , il n’y a pas 
de solution entière : on peut donc sup- 
poser a et b premiers entre eux et utiliser 
la résolution de au + bv = 1 (Bezout), 

d’où x = üqc + kb. y = v 0 c ka , avec £/ 0 

et Vq solution particulière de l’équation 
de Bezout et k entier relatif quel- 
conque. 

La solution (w 0 , Vy) peut se trouver par 
essais successifs, si a et b ne sont pas trop 
grands ; sinon, on développe ajb en frac- 
tion continuée et. si ajb — pjcj n est la 
n-ième réduite, on prend la (n 1 )-ièmc 
qui, au signe près, donne u {) = c/,, , 
et Vy = — p n | . Par exemple, si 
355 x + H3 y = 1. on a 355/113 = [3, 7, 
16], d’où p„..\lq„, =22/7 et u 0 = 7. 

v 0 = 22. Cela correspond aussi, si l’on 
veut, à l’application de l’algorithme 
d’Euclide au couple (cl b). 

L’équation : 

<*i*i + a i x 2 + ... +a„x n = c, 
que nous écrirons A X = c avec : 

A = (a i, a 2 a - > et X £:‘ ), 

se résout, en supposant les a, premiers 
entre eux dans leur ensemble, par les 
points d’un réseau à (il 1) dimensions 
(cf. approximations diophantiennes. 
chap. 1) : 

X = cU 0 + X]B t + à 2 B 2 + ... + À„_i B„_[, 

où Uy est solution particulière de l'équa- 
tion de Bezout A X = 1 et où Bj, Bt, 
B„_i engendrent le module des solutions de 

A.X = 0. 

Un système non homogène : 

A,X = c j 
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(/ = 1, 2, r) se discutera dans Z r , où on 
l’écrira : 



1 


avec V, et C vecteurs colonnes de Z'. 
Une condition nécessaire et suffisante 
de résolution est que tous les détermi- 
nants d’ordre y extraits de la matrice 
des coordonnées de (C, V„ V 2 , .... V,,) 
soient divisibles par le P.G.C.D. des déter- 
minants d’ordre Y extraits de la matrice des 
coordonnées de (V„ V 2 , .... V,,). 

Signalons que le théorème des restes 
chinois (y = a t mod nij, pour / = 1 , 2, . . . . 
r) correspond à un cas non homogène, 
avec n = y + 1. Ii se ramène, si les m,- 
sont premiers deux à deux, à une 
seule équation : x = a mod m, avec 
m = m i m 2 m r 

Généralités sur le second degré 
La résolution en entiers de : 

ax 2 + bxy + cy 2 + dx + ey + k = 0, 

équation de conique à coefficients entiers, 
n’est intéressante que dans les cas parabo- 
lique ou hyperbolique. L’étude en a été faite 
par Euler et Lagrange. Dans le cas ellipti- 
que, en effet, il n’y a qu’un nombre fini 
(éventuellement nul) de solutions, qu’on 
peut déterminer par essais successifs. C’est 
ainsi que Gauss a étudié l’équation 
ÜX 2 -b h} 2 = m, avec a et h entiers positifs. 

Dans le cas parabolique , on pose 2 ax + 
by — t, d’où 4 adx 4 aey = t 1 4 ak 
et la résolution, lorsqu’elle est possible, 
conduit à des formules du type : 

f x = x Q u i \ + v \h 2 

1 y — y o + w 2 ^ + v 2 x 2 , 

OU .Yq, V(), Wj, Vj, W 2 , v 2 sont des entiers fixés 
et où A parcourt Z . De telles formules 


nécessitent, en général, diverses constantes 
pour donner toutes les solutions. 

Par exemple : 4 x 2 — 20 xy + 25 y 1 + 

1 4 x — 4 1 y + 18 = 0 conduit aux quatre 
systèmes de solutions : 

( X = 2— 19 A + 60 À 2 
l y = 2 — 10 X 4- 24 À 2 

f jc = 1 + 11 A + 60 À 2 
1 y = 1 + 2X + 24X 2 

x = 16 + 61 A + 60 X 2 
y = 6 + 22X + 24X 2 

f x = 35 -f 91 À + 60 X 2 
[y = 13 + 34À+ 24 À 2 . 

À l’inverse, 2 x 2 + 2 y -J- 1 = 0 n’a évi- 
demment pas de solution. 

Dans le cas hyperbolique , on se ramène 
au centre de coordonnées rationnelles 
a = pl A, P = qi A, et on pose 
x = (p + X)/A, y = {q+ Y)/A, qui 
conduit à : 

a X 2 + b XY + c Y 2 = m . 

Le cas b 2 — 4 ac = D carré parfait 
fournit : 

(«,X+ v i Y) (« 2 X + v 2 Y) = m , 

d’où la résolution par un nombre fini de 
systèmes linéaires : 

f « jX + v, Y — m i 
[ u 2 X+ v 2 Y = m 2 . 

Si b 2 — 4 ac = D n’est pas carré par- 
fait, on est amené à faire intervenir les 
solutions de : 

u 2 + buv + acv 2 = + 1 

(liées aux unités de Q (V^), comme on le 
voit à propos des équations de Pell). On 
obtient alors les solutions de : 

aX 2 + bX Y + cY 2 = m , 

à partir d’un nombre fini d’entre elles. 
Il peut d’ailleurs n’y avoir aucune solu- 
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tion, comme, par exemple, pour 
A ' 2 — 3 V 2 = — 1* 

L’équation 3 a 2 2 xy 2 y 2 = 6 , elle, 
conduit à deux séries de solutions, données 
par : 

3*„ — T y n = (6 — y)(ll — 3 t)" 
et 3x' n — yy' n = (12 — 3 7 ) (1 1 — 3Y)", 

où y = 1 -j- VJ est racine de y 2 2 y 6 
— 0 et où (11 — 3 y)” correspond aux 
solutions de u 2 — 2 uv — 6 y 2 = 1 . 


Équation de Pell 
L’équation de Pell : 

x 2 — dy 2 = m 

(appelée également équation de Pell- 
Fermat), où l’on suppose d sans facteur 
carré, joue un rôle particulier dans les 
équations du second degré ; elle est, en 
effet, fondamentalement liée à la recherche 
des unités du corps quadratique Q (V d ). 
Après avoir établi que a 2 dy 2 = m a une 
infinité de solutions entières pour au moins 
un ni tel que | m < 1+2 Vd, on classe 
ces solutions modulo m |, d’où l’existence 
des solutions de a 2 — dy 2 = 1 . 

Si l’on associe aux solutions de a 2 — dy 2 
= 1 les nombres £ = A + y Vd, on voit 
qu’ils forment un groupe multiplicatif et on 
établit l’existence d’une solution fonda- 
mentale (A|, y j ) telle que toutes les solu- 
tions de a 2 — dy 1 = 1 sont données par : 

* +yVd “±(*1 + y 1 V^)«, 
avec A? G Z 

Pour m # 1, l’équation peut ne pas 
avoir de solution (A ' 2 3 y 2 = — 1 -j- 4 k 

par exemple, car a 2 3 y 2 est congru à 0.1 
ou 2, modulo 4). Si a 2 — dy 2 = — 1 est 
résolue en entiers, ses solutions seront 
données à partir d’une solution fondamen- 
taie („Y 0 , >’ 0 ) par : 

x+yVd = ±(x 0 +y 0 Vd)* + \ 


où « 6 Z et (,Y 0 + y 0 Vd) 2 = .y, -+- V, Vd 

défini ci-dessus. 

Le cas général A 2 t/j ' 2 = m, lorsqu’il 
aura des solutions, permettra de ranger 
celles-ci en un certain nombre s de classes, 
données par : 

X +yVd = ±{u k + v t VS)(x 1 +^1 Vdy, 

où fl G Z et *=1,2 5 . 

Le cas m = ± 4 est plus directement lié 
aux unités de Q (V^), qui se recherchent 
sous la forme (a + y ^d)/2 i solution de 
t, 2 + pi ± 1 = 0 avec p 2 ± 4 = u 2 d. Il y a 
évidemment toujours des solutions pour 
m — + 4, données par : 

±2 ( xô 

où n G Z avec (a' 0 , /q) plus petite solution 
positive. Pour m — 4, lorsqu’il y a 

solutions, elles s’exprimeront de même 
sous une forme : 


±2 



+ yoVd y ,+l 


nez. 


L’équation de Pell est aussi liée aux 
développements en fraction continuée de 
Vd. En effet, on établit que les solutions 
de a 2 — dy 2 = 1 correspondent à des 
réduites pjq du développement de Vd, 
Plus précisément, l’unité fondamentale de 
Q (Vd) est (.Y 0 = y 0 Vd), avec les nota- 
tions précédentes, si le développement de 
Vd est de période impaire (il y a alors des 
solutions à a 2 — dy 2 = — 1 ), alors que c’est 
(Xj + V’i Vd), si la période est paire. 

Dans les deux cas, le développement 
de : 


\ WV3) + Vd], 

où I (Vd) est le plus grand nombre impair 
inférieur à Vd, fournit cette solution 
fondamentale par sa k-ième réduite, si la 
période est k . 
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Coniques 

L’équation : 

ax 2 + by 2 + cz 2 — 0, 

où l’on peut supposer a, b et c sans facteurs 
carrés et premiers entre eux deux à deux, 
conduit à un théorème de Legendre : une 
condition nécessaire et suffisante de réso- 
lubilité est que a , b , c ne soient pas de 
même signe et que bc, — CU et — ah 
soient respectivement résidus quadrati- 
ques de a, b et C (un résidu quadratique de 
a est un entier p premier avec a tel que 
X 2 = P mod a soit résoluble en x ; cf. 
divisibilité, chap. 4), et alors il y a une 
solution avec x ^ V 2 | bc |, /y ^ V2 ca, 
Z ^ V2\ab\. On a d’ailleurs là un cas 
particulier du théorème de Minkowski- 
Hasse, suivant lequel : une forme quadra- 
tique à coefficients rationnels représente 
zéro (c’est-à-dire s’annule pour un système 
de valeurs non toutes nulles des variables 
dans le corps considéré) dans le corps 
des rationnels si, et seulement si, elle 
représente zéro non trivialement dans tous 
les corps p-adiques et dans le corps des 
réels. C’est dire encore qu’une forme 
quadratique à coefficients entiers ne 
s’annulera pour des valeurs entières des 
variables que si, et seulement si, son égalité 
à zéro, modulo p n \ est résoluble, quels que 
soient le nombre premier p et l’entier 
naturel m, en solutions entières non toutes 
divisibles par p. On dit alors que les 
conditions de congruence sont satisfaites, 
Ici encore on sait majorer la taille d’une 
plus petite solution. Un théorème de Che- 
valley, sur les formes de degré strictement 
inférieur au nombre des variables, permet 
d’affirmer que : 

f(x h x 2 , = 0 (mod p) 

a une solution non nulle, si n > 3, pour 
toute forme quadratique. En combinant 


cela avec le lemme de Hensel, on voit que 
les conditions de congruence à vérifier sont 
en nombre fini. 

Dans le cas de deux variables : 

ax 2 + 2bxy + cy 2 = 0 (mod/>), 

avec p 7 ^ 2 , a une solution et une seule si, 
et seulement si, (ac — b 2 ) est ou bien un 
multiple de p , ou bien l’opposé d’un résidu 
quadratique de p . 

Notons enfin que Dickson a établi que, 
si : 

ax 2 + by 2 + cz 2 —0 

est résoluble, avec a, /?, c premiers entre 
eux deux à deux et sans facteurs carrés, il 
s’ensuit que tout entier peut s’exprimer 
sous la forme ax 2 -|- b y 2 -f- cz 2 . 

Équation de Pythagore 

L’équation de Pythagore : 

x 2 +y 2 = z\ 

est un cas suffisamment classique pour 
qu’on s’y arrête. Si l’on suppose (à', y, z) 
solution en entiers premiers entre eux, l’un 
des deux nombres x ou y est pair. Suppo- 
sons que ce soit x. 11 vient : 

(ïr-m*-?) 

qui entraîne : 

(z + y)/ 2 = a 2 et (z —y)/2 = b 2 , 

d’où les solutions générales positives don- 
nées par : 

x - 2ab y y = a 2 — b 2 , z = a 2 + b 2 , 

avec (a, b) = 1. Cl > b > 0 et a et b de 
parité différente. On trouve pour a = 2 et 
b = 1 la plus petite solution non banale : 
(4, 3, 5). 

Il est intéressant de signaler que l’étude 
du groupe orthogonal de la forme qua- 


265 



DIOPHANHENNES équations 


dratique (x 2 -|- y 2 z 2 ) conduit à envi- 
sager ici les matrices de ce groupe, 
à éléments entiers. On peut établir que, 
si : 



toutes les solutions entières, premières 
entre elles, de l’équation de Pythagore, 
peuvent s’obtenir à partir de la solu- 
tion (3, 4, 5) par application répétée de 
S, T, U dans un ordre quelconque (cf. 
figure). 

Avant d’abandonner le second degré, 
citons l’équation : 

x 2 -j-y 2 = z 2 + t 2 , 

et, plus généralement, le système : 

x\+y]=xl+yl= ... =x 2 r +y 1 r , 


en liaison avec l’étude du nombre des 
représentations p,(n) d’un nombre n 
comme somme de deux carrés ; on démon- 
tre que : 

lim p 2 {n ) = + oo. 

n — + « 


2. Le grand théorème de Fermât 

Pierre de Fermât (1601-1665) fut un 
mathématicien d’une érudition extraordi- 
naire (géométrie analytique, fondements 
du calcul infinitésimal, lois de l’optique, 
fondements du calcul des probabilités et 
surtout théorie des nombres). Malheureu- 
sement, presque tous ses théorèmes étaient 
donnés sans démonstration, car il était 
alors d’usage de proposer ses découvertes 
à la sagacité de ses interlocuteurs (avec en 
particulier une rivalité très vive entre 
géomètres anglais et géomètres français). 
Le théorème élémentaire de Fermât 



Solutions entières premières entre elles de f équation de Pythagore 
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(ü p Cl est toujours divisible par p si p est 
premier), de même que toutes ses études 
sur les formes quadratiques et sur l’équa- 
tion de Pell (appelée souvent Pell-Fermat) 
ont été vérifiés et établis dès le XVIII e siècle, 
ainsi que la plupart des énoncés qu’il a 
affirmés, à l’exception de ce que l’on 
appelle le grand théorème de Fermât (on dit 
aussi le « dernier théorème de Fermât »). 
La recherche d’une démonstration de ce 
résultat a constitué, comme on le voit 
ci-dessous, une motivation essentielle dans 
le développement des mathématiques et a 
contribué à l’élaboration de l’algèbre 
moderne. Une démonstration définitive a 
été donnée par le mathématicien britanni- 
que A. Wiles en 1993-1995. 

Ce « théorème » consiste en la propo- 
sition suivante : Pour n ^ 3, l’équation 

X n + y n = z n 

est impossible en nombres entiers avec 
xyz ^ 0. L’auteur affirme cette proposi- 
tion, en 1637, dans une annotation mar- 
ginale des œuvres de Diophante ; il y écrit : 
« J’ai découvert une démonstration assez 
remarquable de cette proposition, mais elle 
ne tiendrait pas dans cette marge. » 

Il suffirait d’établir ce théorème pour 
lt = 4 et pour tout nombre premier p. 
Malheureusement, si la démonstration 
pour x 4 + y 4 = z 4 est assez simple par la 
méthode de descente infinie, si Euler et 
Gauss traitent le cas de y = 3 de même, si 
Legendre en 1823 met au point le cas de 
p = 5 (par montée infinie), le théorème a 
été très difficile à établir dans sa généralité. 

Pour n =. 4, la démonstration de Fré- 
nicle (1676) repose sur la descente infinie 
dont le principe était donné par Fermât : 
raisonnant sur l’équation de Pythagore 
(.Y 2 ) 2 + (y 2 ) 2 = z 2 , on obtient, à partir de 
toute solution éventuelle (x 0 , J’q, z 0 ), une 


nouvelle solution où Zj < Zq |, ce qui 
permet de conclure à l’impossibilité. 

Notons aussi l’impossibilité de x 4 + y 4 
=- 2 Z 2 , si x 2 ^ J' 2 (d’où l’impossibilité de 
trouver trois entiers dont les puissances 
quatrièmes soient en progression arithmé- 
tique de raison non nulle). 

De même x 4 -f~ y 4 =3 z 2 est impossi- 
ble (comme x 2 -j- y 2 = 3 z 2 ) et, d’une 
manière plus générale, x 4 + y 4 = kz 2 est 
impossible pour 3 ^ k ^ 16, sauf k = 8 
(études générales de Maillet en 1900). 

Pour n = 3, la démonstration ébauchée 
par Euler en 1774 fut précisée par Gauss. 
Comme dans le cas général de n premier 
quelconque, la recherche se scinde en deux 
étapes : on montre d’abord l’impossibilité 
en nombres non divisibles par 3 ; pour 

cela, on déduit de x 3 -f- y 3 = z 3 la 

congruence : 

x 3 + y 3 = z 3 (mod 9), 

d’où : 

x + y == z (mod 3), car a ~ a 3 (mod 3), 
d’où : 

x 3 + y 3 = {x F y + 3 w) 3 

= x 3 +y 3 + 3 (mod 9), 

donc : xy (x + y) = xyz = 0 (mod 3), 

ce qui est impossible sans que x, y ou z soit 
divisible par 3. 

La dernière étape est plus délicate et 
repose sur une descente infinie : on sup- 
pose une solution de x 3 -j- y 3 = z 3 , avec 
xyz minimum et on pose : 

X = u +w, y = U - w , 

d'où : 2 u(u 2 + 3 w 1 ) = z 3 , 

qui conduit à u 2 + 3 H’ 2 = S 3 , si (w, 
3) = 1. Si, au contraire, 3 divise w, on pose 
U = 3 v, d’où 18 v (3 v 2 -h w 2 ) = z 3 
conduisant à 3 V 2 + w 2 — s 3 . Les solu- 
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tions de s 3 — a 2 3 6-, mises sous la 
forme : 

s = a 2 + 3 P 2 , a = a 3 — 9 ap 2 
et b = 3 a 2 P — 3 P 3 , 
conduisent alors à : 

2 a = a 3 , a — 3 p — r 3 et a + 3 p = p 3 , 

où p 3 -|- t 3 ^ a 3 , avec par < xyz |. 

Pour n = 5, la démonstration faite par 
Legendre en 1825 repose sur : 

* 5 = (z—y)<p{x,y), 
où 4<p(x,y) = 5 {x 2 +y 2 ) 2 — {x—yy 

= (2 x 2 + xy + 2 y 2 ) 1 — 5(xy) 2 ; 

cela permet d’établir que cp (x, y) doit avoir 
des diviseurs aussi grands qu’on veut 
(méthode de montée infinie). 

La mathématicienne Sophie Germain a 
établi que, si n est premier ainsi que 
(2 n — j- 1), il faudrait, pour que l’équation 
de Fermât soit vérifiée, que X, y ou Z soit 
divisible par n . Ce résultat a été généralisé 
par Legendre. 

Lamé, en 1837, établit le cas n = 7 
après que Lejeune-Dirichlet ait démontré, 
en 1832, l’impossibilité pour n = 14. 

L'étude générale, pour n premier 
impair, comprend donc deux étapes. Dans 
la première étape, appelée souvent « pre- 
mier cas du théorème », on démontre qu’il 
n’y a pas de solution parmi les entiers non 
multiples de n. Dans la deuxième étape, 
appelée « deuxième cas du théorème », on 
montre qu’il n’y a pas de solution dont l’un 
des nombres soit multiple de n. Cette étude 
générale fut entreprise par Kummer en 
1844 et utilise le corps Q (p) des nombres 
algébriques de degré (n — 1) définis par 
l’équation p" { ~ 0. En effet, si (X est 
une racine primitive n-ième de l’unité, 
l’équation de Fermât s’écrit : 

x n = (z— y)<p{z,y), 


avec : 

<j)(z,y) = (z + ya)(z + ya 2 )...(z q-ya"- 1 ). 

C’est en se plaçant dans Q (p) que 
Kummer essaya, à partir des entiers com- 
plexes m 0 + M\<1 + + m n _\ a n ~ l (m, 
entiers), de raisonner par décomposition 
en facteurs premiers de cp (z, y). Malheu- 
reusement, cette décomposition n’est pas 
toujours unique, et c’est a cette occasion 
que Kummer introduit la notion de nom- 
bre idéal (Cf. anneaux commutatifs). Ces 
nombres idéaux, n’appartenant pas au 
corps envisagé, permettent la décomposi- 
tion unique en facteurs idéaux premiers. 
Cette notion d’idéal fut précisée, un peu 
plus tard, d’un point de vue purement 
algébrique, par Dedekind. 

Kummer obtint des résultats spectacu- 
laires, mais encore incomplets : le théo- 
rème de Fermât est vérifié pour tout 
premier p pour lesquels le nombre de 
classes d’idéaux n’est pas divisible par p 
(un tel nombre p est appelé nombre 
premier régulier). On ne sait pas, actuel- 
lement, s’il existe un nombre infini de 
nombres premiers réguliers ; seuls 37, 59 et 
67 sont non réguliers dans la première 
centaine. Mirimanoff en 1893 démontre le 
cas p ■=. 37 en perfectionnant la méthode 
de Kummer. En 1968, on avait établi le 
théorème de Fermât pour tous les nombres 
premiers jusqu’à 125 000, et pour un 
certain nombre d’autres. La démonstra- 
tion de Wiles clôt une longue histoire de 
tentatives infructueuses. 


3. Méthodes géométriques 

Pour classer les types d’équations, on 
utilise d’abord la dimension, ou nombre de 
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variables indépendantes, du système pro- 

posé. Ainsi, en général, un système : 

f\( x i> •••>*„) = o 

f r (x î, = 0 

est de dimension ( n — Y). En dimension 1, 
on parle de courbes ; en dimension 2, de 
surfaces (Cf. géométrie algébrique). Les 

solutions en nombres entiers ou rationnels 
du système proposé ne sont autres que les 
points entiers ou rationnels de la variété 
algébrique associée. 

Déjà pour les courbes planes (une 
équation /(x, y) = 0), la classification par 
le degré s’avère trop grossière. Ainsi la 
théorie des cubiques planes à point double, 
comme : 

y 2 = x 2 (x + a), 

avec a rationnel, est très simple, celle des 
cubiques planes sans point double, 
comme : 

y 2 = x(x + a)(x + b ), 

avec a q t b rationnels non nuis et distincts, 
est beaucoup plus délicate (cf. courbes 
algébriques). On est ainsi amené à utiliser 
des « invariants » de nature géométrique. 
Pour les courbes, on utilise le genre, 
nombre de trous de la surface de Riemann 
correspondante. Pour une courbe plane de 
degré ci, à points multiples ordinaires, le 
genre vaut : 

(d — 1) (rf — 2) s/(s, — 1) 

2 2L 2 

où la sommation s’étend à tous les points 
multiples, l’ordre de ceux-ci étant s,. 

Courbes de genre zéro 
On dispose ici d’une analyse complète, En 
ce qui concerne les points rationnels, la 
démarche est la suivante. Toute courbe de 


genre zéro peut, par un changement de 
variables, être ramenée à une conique 
plane (D. Hilbert-A. Hurwitz, 1891), soit 
ax 2 + b) 21 + c = 0. D’après le théorème 
de Legendre (cf. supra), les conditions de 
congruence permettent de décider si cette 
conique a un point rationnel. S’il y a un 
point rationnel, soit M 0 , on peut les décrire 
tous, au moyen d’une paramétrisation 
biunivoque : 

* =m y = g(o, 

avec /et g des quotients de polynômes à 
coefficients rationnels (chaque point 
rationnel de la conique correspond à une 
unique valeur, rationnelle, du paramètre t). 
Une telle paramétrisation sera dite poly- 
nomiale. Pour obtenir cette paramétrisa- 
tion, on fait simplement tourner une droite 
autour de M 0 ; chaque droite de pente 
rationnelle f, passant par M 0 , recoupe la 
conique, qui est de degré 2, en un unique 
point, à coordonnées (x = f(t), y = g(r)) 
rationnelles. C’est ainsi qu’a été résolue 
plus haut l’équation de Pythagore. 

Pour les points entiers sur une courbe 
de genre zéro, on dispose aussi d’une 
analyse complète (C. L. Siegel, 1929) : 
essentiellement, l’équation de Pell (cf. 
SUpra) est le seul cas non évident où il peut 
y avoir une infinité de points entiers. 

Courbes de genre 1 : 
points rationnels 

Ici, les conditions de congruence ne suffi- 
sent plus à assurer l’existence d’un point 
rationnel, comme le montre l’exemple 
3 *3 + 4 y* + 5 = 0 (E. S. Selmer, 1951). 
On dispose cependant d’un procédé 
remontant à Fermât (descente infinie) 
permettant d’étudier de telles courbes. 
C’est un problème ouvert de savoir si 
l’application systématique de ce procédé, 
conjointement avec les conditions de 
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congruence, suffit toujours à déterminer la 
présence ou l’absence d’un point rationnel 
sur une courbe de genre 1. 

Si l’on connaît un point rationnel sur 
une telle courbe, celle-ci peut être ramenée 
(Poincaré, 1901) à une cubique plane non 
singulière : 

(C) y* = p(x), 

avec P(x) un polynôme du troisième degré 
sans facteur multiple. On a là une courbe 
elliptique, objet fondamental tant en géo- 
métrie algébrique qu’en théorie des nom- 
bres. La géométrie algébrique montre 
qu’on ne peut pas ramener une telle courbe 
à une courbe de genre zéro. Il existe 
pourtant une paramétrisation des solutions 
complexes de (C), bien classique, mais, 
elle, de nature transcendante : la paramé- 
trisation par les fonctions elliptiques 
(Weierstrass; cf. COURBES ALGÉBRIQUES). 
On voit sur cette paramétrisation que les 
solutions complexes de (C) peuvent être 
munies d’une structure de groupe abélien. 
En fait, la composition ainsi définie induit 
une composition des points rationnels de la 
cubique. Essentiellement, il s’agit de la 
construction suivante. Etant donné deux 
points rationnels de la cubique, la droite 
qui les joint, qui est à coefficients ration- 
nels, recoupe la cubique en un troisième 
point, dont les coordonnées sont par force 
rationnelles : c’est le procédé de la corde 
pour engendrer de nouvelles solutions (on 
peut aussi utiliser la tangente en un point 
rationnel). On obtient ainsi une structure 
de groupe abélien sur l’ensemble des 
points rationnels de (C). L’important théo- 
rème de Morde 11 ( 1922 ), généralisé par 
Weil ( 1928 ), établi par descente infinie, dit 
que ce groupe appelé depuis groupe de 
Mordell-Weil, admet un nombre fini de 
générateurs. En d’autres termes, étant 
donné une cubique (C), il existe un nombre 


fini de points rationnels situés dessus tels 
que tous les autres points rationnels de (C) 
puissent être obtenus à partir de ceux-ci 
par itération du procédé de la corde et de 
la tangente. Etant donné une courbe (C), 
on sait borner le nombre minimal de 
générateurs du groupe de Mordell-Weil 
associé (rang), mais on n’a pas de méthode 
générale pour déterminer le rang, a fortiori 
pour construire explicitement un système 
de générateurs. On dispose seulement d’un 
algorithme conditionnel (Yu. 1. Manin, 
1973 ), reposant sur deux conjectures. 
L’une, de Weil, relie les courbes elliptiques 
aux formes modulaires. L’autre, de 
B. Birch et H. P. F. Swinnerton-Dyer 
( 1965 ), affirme que le rang d’une courbe 
elliptique est donné par l’ordre du zéro au 
point complexe Z = 1 d’une certaine fonc- 
tion méromorphe dont la définition fait 
intervenir le nombre de solutions modulo 
p, nombre premier, de l’équation (C), cela 
pour tous les nombres premiers p (cf. 
fonction ZETA). L’ordinateur a donné un 
grand poids à cette conjecture, et des 
progrès théoriques ont été effectués. 

Courbes de genre au moins égal à 2 : 
points rationnels 

Parmi les courbes de genre au moins égal 
à 2, on trouve les courbes planes non 
singulières de degré au moins 4. Là encore, 
on ne peut ramener l’étude de telles 
courbes à l’étude de celles de genre infé- 
rieur ou égal à 1. On ne dispose d’aucun 
procédé permettant d’engendrer un 
nombre infini de solutions à partir d’un 
nombre fini d’entre elles. Morde 11 a ainsi 
conjecturé (1922) qu’une telle équation 
n’admettrait jamais qu’un nombre fini de 
solutions rationnelles. Cette conjecture a 
été démontrée par G. Faldings en juin 
1983 et a constitué une étape importante 
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dans la démonstration du grand théorème 
de Fermât. 

Points entiers sur les courbes 
de genre au moins 1 

On dispose du théorème général de 
C. L. Siegel (1929) selon lequel une telle 
courbe n’a qu’un nombre fini de points 
entiers. La démonstration utilise d’une 
part le théorème de A. Weil ( 1928 ), 
étendant celui de Mordell, d’autre part la 
mauvaise approximation par des ration- 
nels des irrationnels algébriques (cf. 
approximations diophantiennes). Ce 
résultat englobe celui de Thue ( 1909 ), lui 
aussi fondé sur les approximations dio- 
phantiennes : l’équation 

/(*, Y) = m, 

OÙ f est un polynôme homogène irréduc- 
tible à coefficients entiers de degré au 
moins égal à 3, et m est un entier non nul, 
ne possède qu’un nombre fini de solutions 
entières. 

Dans beaucoup de cas, en particulier 
pour les équations y 2 = P(x) où le poly- 
nôme P a au moins trois zéros distincts, A. 
Baker a donné des majorations effectives 
(mais grandes) pour la taille possible des 
solutions entières ; ainsi, pour l’équation 
de Thue ci-dessus : 

max(|jc| f |y|) < exp {(</H)0<*) J }, 

où d est le degré de /, et H un entier 
dépendant de la taille de m et des coeffi- 
cients de f. Dans certains cas particuliers, 
ces méthodes permettent même de trouver 
toutes les solutions entières, 

Surfaces rationnelles 

Les surfaces rationnelles sont les analogues 
en dimension 2 des courbes unicursales, 
celles qui peuvent être paramétrées de 
façon polynomiale si l’on autorise les 


coefficients des polynômes définissant le 
paramétrage à être des nombres comple- 
xes. Parmi celle-ci, on trouve les surfaces 
non singulières de l’espace ordinaire défi- 
nies par une équation de degré 2 (quadri- 
ques) ou 3 (surfaces cubiques), mais 
aussi des équations de degré supérieur, 
comme : 

y 2 + a(x)z 2 + b(x) = 0, 

avec æ(a') et b(x) des polynômes non nuis 
de degré quelconque. 

On est loin de disposer ici de résultats 
aussi satisfaisants que pour les courbes de 
genre zéro. Dans certains cas : quadriques 
(Hasse-Minkowski, cf. supra), surfaces 
cubiques 

ax 3 + by 3 + cz 3 + cf = 0, 

avec ab = cd # 0 (E. S. Selmer, 1953), les 
conditions de congruence (et la condition 
réelle) suffisent à assurer l’existence de 
points rationnels. Cela ne vaut pas en 
général, comme le montre l’exemple 
(J. W. S. Cassels-M. J.T. Guy, 1966) : 

5x 3 + 9 y 3 + 10z 3 + 12 = o 

Si une quadrique a un point rationnel, 
on peut encore donner une paramé- 
trisation polynomiale essentiellement 
biunivoque des points rationnels, en utili- 
sant la même méthode que pour les coni- 
ques. 

Une telle paramétrisation est encore 
possible pour une surface cubique de 
l’espace ordinaire, soit Z, qui contient deux 
droites D et D’ définies par des équations 
à coefficients rationnels, et ne se coupant 
pas. Choisissons un plan TT, d’équation 
ax + by -(- cz -f- d = 0 , avec a, b , c. d 
rationnels. Pour M un point rationnel du 
plan 7T, la droite D M , intersection des deux 
plans engendrés l’un par (M, D), l’autre 
par (M, D’), est définie par des équations 
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à coefficients rationnels, Elle coupe la 
surface cubique Z en trois points : celui qui 
est situé sur D et celui qui est situé sur D’ 
sont définis par des équations à coefficients 
rationnels, le troisième, soit /(M), est donc 
à coordonnées rationnelles. On vérifie que 
la correspondance qui à M associe J’(M) 
définit une paramétré ation poiynomiale 
essentiellement biunivoque des points 
rationnels de Z par ceux de TT. C’est ainsi 
qu’on trouve la solution générale due à 
Euler de l’équation : x 3 + V 3 + Z 3 = 1 

_ 1 — (« — 3 V ) (w 2 + 3 v 2 ) 

d 

(u + 3v)(w 2 + 3v 2 ) — 1 

y _ _ 

(u 2 + 3 v 2 ) 2 — (m + 3 v) 

2 = d 

avec d = (u 2 + 3v 2 ) 2 — (u — 3 v). 

Des méthodes fines de géométrie algé- 
brique montrent qu’une telle paramétrisa- 

tion polynomiale biunivoque à coefficients 
rationnels est souvent impossible, ainsi 

pour : 

x 3 + y 3 + z 3 = a, 

où a est un rationnel qui n’est pas un cube 
(Yu. 1. Martin, 1970). On peut cependant, 
pour une surface cubique non singu- 
lière qui possède au moins un point 
rationnel, trouver des familles polynomia- 
les à deux vrais paramètres (c’est-a-dire 
qu’on ne peut réduire à un seul paramètre), 
soit : 

X = A(u, v), y = B(w, v), z = C («, v), 

avec A,B,C quotients de polynômes en u et 
y à coefficients rationnels, mais en général 
même un nombre fini de telles familles ne 
suffit pas à décrire tous les points ration- 
nels de la surface cubique. On obtient 
néanmoins beaucoup de solutions ration- 
nelles En spécialisant les paramètres, on 


obtient par exemple que tout rationnel est 
somme de trois cubes de rationnels : 

a' + Va J' 

avec d = 3 2 a 2 + Va + 3 6 

(Ryley, 1825 ; H. W. Richmond, 1930). 

En s’inspirant de la méthode de 
Mordell-Weil, F. Châtelet (1959) a montré 
qu’un nombre fini de solutions paramétri- 
ques polynomiales (à 4 variables) permet 
de décrire toutes les solutions rationnelles 
de : 

y 2 — az 2 = x(x— b) (x — c), 

avec a , b , C rationnels non nuis. On ignore 
par contre si une solution polynomiale, 
même partielle, à deux vrais paramètres et 
à coefficients rationnels est possible pour 
l’équation générale : 

y 2 —a(x)z 1 = b(x), 

où a(x) et b(x) sont des polynômes non 
nuis. 

Pour les points entiers des surfaces 
cubiques, on a des résultats épars. Soit par 
exemple l’équation : 

x 3 + y 3 + z 3 = n, 

avec n entier fixé, à résoudre en (x, )\ z) 
entiers. On voit facilement (congruences 
modulo 9) qu’il n’y a pas de solutions 
si il est congru à ± 4 modulo 9. Sinon, 

on ne sait pas s’il y a toujours une solu- 

tion, par exemple pour n = 30, et, s’il y 
en a une, s’il y en a une infinité. L’iden- 
tité : 

(1 + 6/ 3 ) 3 + (l — 6 f 3 ) 3 + ( — 6t 2 y = 2 

donne une infinité de solutions pour n = 2, 
mais, pour n = 3, on ne connaît que les 
solutions (1, 1, 1) et (4, 4, 5). 
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Pour : 

x 2 + yi + z 2 — axyz = b, 

avec a et è entiers, on dispose d’un 
processus (Markov, Hurwitz) permettant 
d’engendrer toutes les solutions entières à 
partir d’un nombre fini, explicitement 
calculables, d’entre elles. 

On conjecture (P. Erdôs, E. G. Straus) 
que l’équation : 

4 /n = 1/x + l/y + \/z, 

avec n entier fixé, n > 1, à résoudre en 
entiers positifs x, y, z, a toujours des 
solutions (c’est un cas particulier du pro- 
blème des fractions égyptiennes, où l’on 
cherche à écrire un rationnel comme 
somme d’un nombre donné d’inverses 
d’entiers). Cette conjecture a été établie 
pour n ^ 10 8 . 

Surfaces analogues aux courbes 
de genre 1 

L’analogue immédiat, du point de vue de la 
géométrie algébrique, consiste en les surfa- 
ces abéliennes (pour lesquelles il est difficile 
de donner des équations !). Le théorème de 
A. Weil (1928) nous renseigne sur les points 
rationnels, mais on ignore s’il n’y a qu’un 
nombre fini de points entiers. 

Un autre analogue consiste en les sur- 
faces non singulières de l’espace ordinaire, 
de degré 4. Une conjecture d’Euler affirme 
que l’équation : 

x 4 + y 4 + z 4 = 1 

n’a pas d’autres solutions rationnelles que 
(± 1, 0, 0), (0, ± 1, 0) et (0, 0, ± 1), mais 
on sait seulement qu’une autre solution 
devrait avoir un dénominateur au moins 
égal à 220 000. Euler donna une infinité de 
solutions rationnelles de : 

x* -y y 4 = z 4 + l, 


au moyen d’une solution à un paramètre ; 
par exemple : 

t 1 + t 5 — 2 t 3 + 3 t 2 + t 
x = 

d 

t 6 — 3/ 5 — 2t 4 + t 1 4- l 
' = d 

_U + / 5 — 2/ 3 — 3/ 2 + / 

Z “ d 

avec d = t 6 + 3t 5 — 2/ 4 -M 2 +l 

(Géraudin, 1917). 

La géométrie algébrique montre qu’au- 
CUne solution, même partielle, polynomiale 
à deux vrais paramètres n’est possible. 
Cependant, en utilisant le fait que la surface 
ci-dessus peut être fibrée en courbes ellipti- 
ques, on peut donner une infinité de solu- 
tions essentiellement distinctes à un para- 
mètre (H. P. F. Swinnerton-Dyer, 1971 ). 

Surfaces analogues aux courbes 

de genre au moins 2 

Parmi celles-ci, on trouve les surfaces non 

singulières d’équation : 

f(x,y,z) = 0, 

avec / de degré au moins 5. Une fois de 
plus, elles ne peuvent être ramenées aux 
surfaces précédentes. Il peut exister des 
solutions à un paramètre, mais une conjec- 
ture analogue à celle de Morde 11 pour les 
courbes de genre au moins 2 voudrait que, 
pour une telle surface, les points rationnels 
soient concentrés sur un nombre fini de 
courbes algébriques tracées sur la surface. 

4. Équations à beaucoup de varia- 
bles 

La méthode du cercle de Hardy- 
Littlewood-Vinogradov, qui avait déjà 
révélé sa puissance dans l’étude du pro- 
blème de Waring (cf. théorie des nombres 
- Théorie analytique des nombres), a aussi 


273 



DI O PHA NU EN N ES ÉQUATIONS 


permis d’obtenir le résultat suivant 
(H. Davenport, B. Birch, 1962). Soit /],.... 
f. des formes homogènes de degré d, en n 
variables, à coefficients entiers. Supposons 
que le système : 

r f x (x !, . = cl 

[f r (x h .",x n )=0 

n’a pas de solution complexe singulière 
non nulle. Si les conditions de congruence 
sont satisfaites, si le système a une solution 
non nulle en nombres réels et si : 

(*) n> r(r + 1 ) ( d — 1 ) 2 d ~\ 

alors le système a une solution non nulle en 
nombres entiers, On peut appliquer ce 
résultat par exemple à une forme cubique 
en au moins 17 variables (toute forme telle 
a un zéro non trivial), ou à un système de 
deux formes quadratiques en au moins 
13 variables. 

Si les conditions de congruence (et la 
condition réelle) ne sont pas en général 
suffisantes quand le nombre de variables 
est très petit par rapport au degré (ainsi 
r — 1, d = 3, n = 4, cf. supra), on peut 
se demander si on ne peut pas affaiblir 
l’inégalité (*). On ignore ainsi si, pour une 
forme cubique non singulière en au moins 
5 variables, les conditions de congruence 
sont suffisantes. 

On se demande si une équation non 
singulière : 

f(x x„) = 0 

de degré d ^ H a une infinité de solutions 
rationnelles dès qu’elle en a une. Considé- 
rons par exemple l’équation : 

x\ + ... + X* = 1, 

Pour d = n = 4, à part les solutions 
évidentes du type (1, 0, .... 0), on connaît : 

(240/651, 340/651, 430/651, 599/651), 


mais on ne connaît pas de solution à un 
paramètre. Pour d = n = 5, on connaît 
des solutions à deux paramètres. On 
connaît par ailleurs beaucoup de solutions 
de l’équation u e + V 6 + W 6 = Z 6 + t 6 + 1 
(A. Bremner, 1980), par une méthode 
inspirée de celle qui est mentionnée pour 
l’équation X 4 + V 4 = Z 4 + 1. 

5. Équations diophantiennes 
exponentielles 

On appelle ainsi les équations du type : 

où f est un polynôme en n variables à 
coefficients entiers, à résoudre en entiers 
positifs (x h .. . . x n ,m h . . . . m„). 

Comme équations classiques de ce type, 
résolubles par des factorisations en nom- 
bres entiers, citons : 

x 2 + 1 = y n 

en (x, }\ n), qui n’a pas de solution avec 
n > 1 et y > 1 (V. A. Lebesgues, 1850), 
et : 

x 2 — i =y n , 

qui n’a pas de solution avec n > 1 et > 3 
(Chao Ko, 1964). 

Pour établir une conjecture de Rama- 
nujan, l’équation : 

* 2 + 7 = 2" 

n’a pour solutions que U = 3, 4, 5, 7. 15, 
Nagell (1960) eut recours à la théorie 
algébrique des nombres (calculs dans le 
corps Q (V— 7 ). 

Les résultats d’A. Baker sur les formes 
linéaires de logarithmes ont permis de 
réaliser d’importants progrès (cf. nombres 
transcendants) . Il s’agit en fait de métho- 
des d’approximation. 
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Ainsi, pour f (.y) un polynôme à coef- 
ficients entiers avec au moins deux zéros, 
on sait (A. Schinzel, R. Tijdeman, 1976) 
qu’il n’y a qu’un nombre fini d’entiers m 
pour lesquels l’équation : 

y m = /(*) 

a des solutions avec y > 1. 

En 1976, R. Tijdeman, utilisant ces 
méthodes, a montré que l’équation de 
Catalan : 

x m —y n = 1 

(en x, y, m, n entiers naturels) n’a qu’un 
nombre fini de solutions, et ce, par une 
méthode effective (x m < exp exp exp 250, 
Langevin, 1976). La conjecture de Catalan 
est ainsi ramenée à un nombre fini (mais 
grand !) de calculs. 

MARCEL DAVID 

et JEAN-LOUIS COLLIOT-THÉLÈNE 
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1 1 est arrivé à plusieurs reprises que 
certaines exigences de la physique, par 
exemple, aient conduit les utilisateurs des 
mathématiques à des « calculs » non rigou- 
reusement justifiables au moyen des 
concepts mathématiques existants, mais 
qui traduisaient avec succès la réalité 
expérimentale. C’est ainsi que l’ingénieur 
Heaviside introduisit dans l’étude des 
réseaux électriques (en 1894) les règles de 
son calcul symbolique , qui ne fut justifié 
mathématiquement que postérieurement. 
L’étude des équations aux dérivées par- 
tielles conduisait aussi naturellement à des 
extensions des matériaux mathématiques 
traditionnels ; ainsi, il est normal de consi- 
dérer que les deux équations : 

ô 2 u/ôxd y = 0 et d 2 u/dydx = 0 

sont équivalentes, et pourtant la première 
est satisfaite par toute fonction u(x) de x 
seul, alors que l’expression d 2 u/dy ôx n’a 
de sens que si w(x) est dérivable en .Y. Des 
considérations de ce type, ainsi que l’étude 
du problème de Dirichlet (trouver une 
fonction harmonique dans un ouvert de R" 
connaissant ses valeurs sur la frontière) 
avec les méthodes de l’espace de Hilbert, 
ont conduit les mathématiciens à généra- 
liser les solutions acceptables d’une telle 
équation en introduisant la notion de 
solution faible . Le mathématicien soviéti- 
que Sobolev a construit, en 1934, des 
classes de fonctions généralisées qui justi- 
fiaient de manière rigoureuse ce genre de 
considération. 

La théorie des transformations de Lou- 
rier et de Laplace exigeait aussi des géné- 
ralisations des fonctions. En 1926, Dirac 
introduisait en physique mathématique sa 
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céTèbre « fonction » 5 0 , nuiie en dehors de 
T’ origine et d’intégraTe égaie à 1, qui 
représentait une impuision unité à F instant 
t — 0 , donc d’effet nui pour t 7^ 0 . Puis- 
que 5 0 n’est pas une fonction au sens usuei 
(car une fonction nuiie pour f ^ 0 est 
d’intégrale nulle), sa justification mathé- 
matique correcte conduisait à une exten- 
sion de la notion de fonction ; remarquons 
que, dans ce cas précis, la théorie de la 
mesure permettait déjà de considérer ô 0 
comme une mesure de masse 1 concentrée 
à l’origine, c’est-à-dire comme un être 
mathématique bien défini. 

Cette extension a été présentée sous sa 
forme actuelle par le mathématicien fran- 
çais L. Schwartz, dans le cadre des espaces 
vectoriels topologiques ; parmi ses nom- 
breuses applications, citons : les équations 
aux dérivées partielles linéaires, la repré- 
sentation des groupes de Lie, les processus 
stochastiques, les variétés différentiables, 
la physique mathématique, la physique 
expérimentale (« déconvolution » et iden- 
tification de systèmes). 

La construction des distributions due à 
L. Schwartz admet de nombreuses varian- 
tes conduisant à des classes de fonctions 
généralisées ayant chacune un domaine 
privilégié d’applications : fonctions géné- 
ralisées de divers types introduites par les 
mathématiciens soviétiques Guelfand et 
Silov dans l’étude des équations aux déri- 
vées partielles ; hyperfonctions de Sato- 
Martineau, très utiles dans l’étude des 
fonctions de plusieurs variables complexes 
et les problèmes aux limites ; fonctions 
généralisées de Beurîing-Bjdrk ; etc. 

L’exposé qui suit suppose seulement 
connue la notion d’espace vectoriel 
(cf. algèbre ou algèbre linéaire et mul- 
TILINÉAIRE) et la notion de suite conver- 
gente de nombres complexes (cf. nombres 

COMPLEXES) . 




1. Espaces avec notion 
d e suite convergente 

Les conditions de continuité qui intervien- 
nent dans la définition des distributions 
peuvent s’exprimer élémentairement en 
utilisant seulement la notion de suite 
convergente, sans qu’il soit nécessaire de 
préciser complètement la topologie des 
espaces considérés. On se propose ici de 
montrer comment on peut définir a priori 
et de manière purement formelle une telle 
notion sur un espace vectoriel. Les espaces 
vectoriels sont sur le corps R des nombres 
réels ou le corps C des nombres comple- 
xes. 

Définition 

Soit E un espace vectoriel. On dit qu’on a 
défini dans Eune notion de suite convergente 
si on s’est donné un sous-ensemble £ de 
l’ensemble de toutes les suites d’éléments 
de E et une application de £ dans E qui à 
toute suite (x w ) de £ fait correspondre un 
élément x £= E, ce qu’on écrira (de manière 
purement formelle) : (x„) — ► .V dans E, et 
ce qu’on lira : La suite (xJ converge vers .Y ; 
les éléments de £ s’appellent suites 
convergentes. On impose aux données pré- 
cédentes les conditions suivantes : 

[a) Pour tout élément X (E E, la suite 
constante (.Y, x, .... x, . ..) est convergente et 
converge vers x ; 

(h) Si la suite (x„) est convergente et 
converge vers x, alors, pour tout nombre 
A du corps de base R ou C, la suite (A x,,) 
converge vers A x ; 

(c) Si (x n ) et (v n ) sont deux suites conver- 
gentes qui convergent respectivement vers 
X et v, alors la suite (x /7 + y n ) converge vers 

x + y- 
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(d) Si (a' ; j ) converge vers x, toute sous-suite 
de (x /7 ) converge aussi vers x. 

Les conditions ci-dessus sont les pro- 
priétés des suites convergentes (au sens 
usuel) de nombres réels ou complexes. 
Comme toujours dans l’approche formelle 
d’une notion, on retrouve donc, sous 
forme d’axiomes, des propriétés vérifiées 
dans les situations concrètes qu’il s’agit de 
généraliser. Si une suite (A' /; ) converge vers 
X, on dit aussi que (x, 7 ) a pour limite x et 
on écrit : 

lim x n — x 

n—* 

Remarquons que, pour connaître £, il 
suffit de connaître le sous-ensemble £ 0 de 
£ formé des suites (x /; ) qui convergent vers 
0 (d’après les axiomes, c’est d’ailleurs un 
espace vectoriel pour les opérations usuel- 
les sur les suites). En effet, dire que 
(.Y w ) — ► A' équivaut, d’après les axiomes, à 
dire que la suite (a', 7 .y) tend vers 0, ce qui 

met en évidence que la translation de 
vecteur .y, qui à x n fait correspondre 
X n + .Y, est une bijection de £ 0 sur l’ensem- 
ble des suites qui convergent vers x. En 
abrégé, on dira qu’un espace vectoriel E 
est un e.V.S. si on a défini dans E une notion 
de suite convergente. 

Un exemple fondamental 
11 est clair que, si E est l’espace euclidien 
usuel de la géométrie dans l’espace, 
l’ensemble des suites convergentes au sens 
usuel satisfait aux conditions précédentes ; 
plus généralement, si E est un espace 
vectoriel normé, muni d’une norme || . | on 
peut définir directement, à partir de la 
norme, les suites (x n ) qui convergent vers 
A' par la propriété suivante : La suite de 
nombres réels positifs || x X n || tend vers 0 
pour u — ► oo ; il est clair que les conditions 
(a) à (d) sont alors satisfaites. L’exemple 


suivant est essentiel dans la définition des 
distributions ; on remarquera qu’on définit 
ici les suites convergentes sans l’intermé- 
diaire d’une topologie. 

Soit Q un sous-ensemble ouvert de R ' 7 
(c’est-à-dire que pour tout point de Q il 
existe une boule de rayon > 0 contenue 
dans Q). Toutes les fonctions considérées 
sont supposées à valeurs complexes. Si <p 
est une telle fonction définie et continue 
dans Q, on appelle support de cp le plus 
petit ensemble fermé en dehors duquel cp 
est nulle ; 5)(Q) désignera l ensemble des 
fonctions définies dans Q, admettant des 
dérivées partielles de tous ordres, et à 
support compact (c’est-à-dire borné et 
fermé dans R 77 ). 

Pour désigner les dérivées partielles 
d’ordre quelconque, on utilise la conven- 
tion des multi-indices (cf. calcul infini- 
TÉSIMAL Calcul à plusieurs variables). Par 
définition, un multi-indice est un système 
de n nombres entiers positifs ou nuis : 

a = (a,, a 2 , a„); 

on écrit alors Ô a j d.Y° OU (djdxf pour 
désigner l’opérateur de dérivation partielle 

(d a[ + «2 + ■■■ r a *)/dx i a i dx 2 a ‘ ... éx„ a « 

= ( ô/dx 1 ) a i(d/dx 2 ) c, 2 ... (d/dx n ) a * ; 

cette écriture permet d’avoir, dans le cas de 
tl variables, une écriture analogue au cas 
d’une variable. 

11 est clair que B(Q) est un espace 
vectoriel ; munissons-le d’une structure 
d’e.V.S. en définissant les suites convergen- 
tes. Soit (cp /? ) une suite d’éléments de 
3)(Q) ; on dira que la suite (cp ) est 
convergente et converge vers une fonction 
(p E 3)(Q) si les deux conditions suivantes 
sont réalisées : 

(a') Toutes les fonctions cp ; „ ainsi que la 
fonction cp, sont milles en dehors d’un 
même compact K de Q ; 
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(h’) Pour tout multi-indice a, la suite des 
dérivées partielles (d a (Ç p /dx a ) converge 
uniformément sur K vers la dérivée par- 
tielle correspondante de cp : 

d Q cp p _ ^ ô a cp 

dx a dx a ’ 

pour p — ► oo. Il est clair que les conditions 
(a) à ( d) sont satisfaites. 

Morphismes 

On va maintenant définir les morphismes 
des e.v.s., c’est-a-dire les applications d’un 
tel e.v.s. dans un autre qui respectent les 
deux notions définissant la structure d’un 
e.V.S. : la structure vectorielle et les « suites 
convergentes ». 

Soit E et F. deux e.V.S. Un morphisme 
U de E dans F est, par définition, une 
application linéaire de E dans F (c’est-à- 
dire telle que u(k x + p y) = A u(x) + 
P w(y), pour x, J G E et A, p dans le corps 
de base R ou C) qui transforme toute suite 
convergente de E en une suite convergente 
de F : si (a'„) — ► x dans E, alors 
(u(x n )) — > w(v) dans F ; on dit aussi que U 
est une application linéaire séquentielle- 
ment continue (ou « continue pour les 
suites »). Pour qu’une application linéaire 
de E dans F soit un morphisme, il faut et 
il suffit qu’elle transforme toute suite 
convergente vers 0 dans E en une suite 
convergente vers 0 dans F. 

Voici deux exemples de morphismes de 
l’e.v.s. 3)(Q) dans lui-même. Si on désigne 
par Ô/ÔX, l’opérateur de dérivation par- 
tielle par rapport à la Même coordonnée 
dans R 7 , l’application cp i— ► d (ç/ôx ) est un 
morphisme de 3)(Q). De même, sifest une 
fonction admettant dans Q des dérivées 
partielles de tous ordres, l’opération de 
multiplication par/, qui s’écrit (p •—**/( p, est 
un morphisme de 9)(Q) dans 5)(Q). 


Si E et F sont deux e.v.s., on peut munir 
l’espace vectoriel C (E, F) des morphismes 
de E dans F d’une notion de suite conver- 
gente en disant qu’une suite u n de mor- 
phismes de E dans F converge vers 
U G £(E, F) si (U„(x)) — ► u(x) dans F pour 
tout élément x G E. En particulier, 
cette définition permet de munir d’une 
structure d’e.v.s. l’espace vectoriel E’ 
des applications linéaires de E dans son 
corps de base qui sont continues pour les 
suites. 

On retrouve dans le cadre des e.V.S. 
l’importante notion de transposée d’une 
application linéaire (cf. algèbres linéaire 
et multilinéaire). Soit, en effet, E et F 
deux e.v.s., et u un morphisme de E dans 
F ; désignons par E’ et F’, comme 
ci-dessus, les e.v.s. des applications linéai- 
res respectivement de E et F dans le corps 
de base (formes linéaires sur E et F), qui 
sont séquentiellement continues. Pour 
toute forme linéaire /G F’, la forme 
g = f o U est une forme linéaire séquen- 
tiellement continue sur E, donc est un 
élément de E’, et on vérifie facilement que 
l’application linéaire t u : F’ — > E’, qui à 
/G F’ fait correspondre fo u G E’, est 
séquentiellement continue ; on définit ainsi 
le morphisme 'u transposé de u. 


2. Définition des distributions 

Il est clair que, pour généraliser la notion 
de fonction, il faut abandonner certaines 
propriétés usuelles des fonctions (par 
exemple le fait qu’une fonction prend une 
valeur déterminée en chaque point) pour 
ne conserver que certaines propriétés. 
L. Schwartz utilise comme notion essen- 
tielle la propriété d’opérer linéairement sur 
des classes de fonctions très régulières. 
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Méthode générale de construction 
La méthode générale pour définir un 
espace de fonctions généralisées sur un 
ouvert Q de R'* est la suivante. On prend 
tout d’abord un e.V.S. Œ de fonctions 
« suffisamment régulières » dans Q ; par 
définition, l’espace des fonctions générali- 
sées sur Q est alors l’espace des formes 
linéaires séquentiellement continues sur 
Pour justifier la terminologie de « fonc- 
tions généralisées », il faut identifier les 
fonctions « régulières » sur Q à des élé- 
ments de TT ; pour cela, on identifie une 
telle fonctionf’à la forme linéaire sur : 

<p) = £/(*)<?(*)<**> 

où .x = (.v b x„) et dx — dx | dx 2 dx n . 

Nous allons préciser ces indications géné- 
rales en construisant en détail les distribu- 
tions proprement dites. 

Définition des distributions 
On prend ici pour espace £ l’e.v.s. 3)(Q), 
défini ci-dessus, des fonctions indéfiniment 
différentiables et à support compact dans 
Q. L’espace 5)' (Q) des distributions dans 
Q est alors par définition l’ensemble des 
formes linéaires T séquentiellement conti- 
nues sur 3) on note indifféremment : 

T(cp) = (T, cp) = < T.q) > = f T(*)c p(x)dx y 

la valeur de la distribution T (forme 
linéaire sur 5)(Q)) sur la fonction 
(f £ 3)(Q). Remarquons que la dernière 
écriture est abusive ; elle est utilisée car elle 
rappelle que, si T est une fonction, l’expres- 
sion de T((p) est donnée par une intégrale. 
Précisons ce point. 

Si / est une fonction intégrable (au sens 
de la théorie de Lebesgue) sur tout com- 
pact de Q (on dit alors quefest localement 


intégrable), on peut l’identifier à la distri- 
bution : 

JV(*>P(*)<**> <p£»(Q); 

les distributions définies par deux fonc- 
tions / et g localement intégrables dans Q 
coïncident si et seulement si f et g « coïn- 
cident » au sens de la théorie de Lebesgue, 
c’est-à-dire sont égales presque partout ; 
ainsi, les distributions ne généralisent pas 
à proprement parler les fonctions, mais les 
classes de fonctions égales presque par- 
tout : si on modifie une fonction en 
changeant sa valeur en un point, par 
exemple, elle définit toujours la même 
distribution ; on a bien abandonné la 
propriété des fonctions d’être définies par 
leur valeur en WUt point. 

La notion d’ e.v.s. permet de définir la 
notion de suites convergentes de distribu- 
tions : si T„ T 2 , T,„ est une suite de 

distributions, on dit, en accord avec la 
définition de V e.v.s. 9)'(Q), que cette suite 
tend vers une distribution T si : 

T(<P) = Bm T„(<p), 

n -* 00 

pour toute fonction cp £ 3)(Q). On peut 
montrer que, si pour toute fonction 
c p £ 3)(Q) la suite de nombres complexes 
T,j(cp) tend vers une limite, l’application 
définie dans 3)(Q) qui à (p £ 3)(Q) fait 
correspondre cette limite est une distribu- 
tion, limite de la suite des distributions T„. 
Cette propriété est généralement très facile 
à vérifier et permet de définir de nombreu- 
ses distributions nouvelles à partir de 
distributions déjà connues. 

La notion de suite convergente de 
distributions permet en particulier de défi- 
nir les séries convergentes de distributions. 
Si (T„) est une suite de distributions, on dit 
que la série de terme général T,, est 
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convergente (au sens des distributions) de 
somme T si la suite des sommes partielles 
est convergente au sens indiqué ci-dessus ; 
on écrit alors I T„ = T. 

Exemples 

a) Soit a un point de R" ; l’application qui 
à toute fonction cp E 3) (R") fait correspon- 
dre la valeur cp (a) de la fonction cp en a est 
une distribution appelée distribution de 
Dirac et notée 6,. Ainsi, avec l’abus 
d’écriture signalé ci-dessus, on a : 

(S„.<p) = | b a (x) dx = ip(a); 

cette distribution permet de donner une 
définition mathématique rigoureuse de la 
« fonction » de Dirac mentionnée plus 
haut. 

b) On vérifie facilement que la fonction 
a définie sur R par 

a(x) - f “P [-1/(1 -x 2 )] si|x<l, 

[ > ~ l 0 Si\x\ïh 

est une fonction indéfiniment dérivable, 
nulle par définition en dehors de l’inter- 
valle [- 1, 1]. Si on pose : 

k = \X a ^ dx ' 


fig. 1 



0, la suite des distributions p £ „ (ou, pour 
être précis, la suite des distributions T w 
définies par ces fonctions) tend vers la 
distribution de Dirac au point 0. 

c) Dans le plan, identifié à R 2 , de la 
variable complexe z, on montre que la 
fonction f(x-\- iÿ) = 1/7T z est intégrable 
sur tout compact ; par suite, cette fonction 
définit une distribution, notée l/îT z, qui, à 
toute fonction cp E 3>(R 2 ), associe : 


la fonction pj(x) = a(x)/k appartient donc 
à 3) (R) et est d’intégrale égale à 1. Plus 
généralement, la fonction : 

P E (*) — (l/e)p(*/e) 

appartient aussi à S)(R) et est d’intégrale 
égale à 1 ; d’autre part, p E est nulle en 
dehors de l’intervalle [— E, e] (fig. 1). 
Comme 

J P e (-*)<p(x)dx^(p(0), si e^O, 


(1/nz, cp ) 


> « 
J Jf 


<p(x>y) 

R 2 ir(x + iy) 


dxdy. 


d) Soit maintenant R 3 l’espace de la 
géométrie élémentaire dans l’espace. La 
fonction x * ► 1/(4tî]|x |) est localement 
intégrable dans R 3 et définit donc une 
distribution, notée 1 / (47r|| X ||). 

e) On peut montrer que, pour toute 
fonction cp E 9(R), et pour toute suite E„ 
tendant vers 0, la suite des nombres 
réels : 


pour toute fonction continue cp, il en 
résulte que, pour toute suite E„ tendant vers 


<p(*) 


dx 


) |*| > E„ 
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tend vers une limite, indépendante de la 
suite (£„) choisie, et que l’application qui à 
cp fait correspondre la limite correspon- 
dante est une distribution, notée v.p.( 1 /jc), 
valeur principale de Cauchy ; ainsi : 

(v.p.(lA), (fi) = lim [ < ~-dx. 

Dans l’étude des équations aux dérivées 
partielles, Hadamard a été conduit à géné- 
raliser cette notion (distributions « parties 
finies »). 


3. Propriétés des distributions 

À partir d’une application linéaire séquen- 
tiellement continue L de 3) dans 9 (opé- 
rateur dans a>), on peut définir, par trans- 
position, un opérateur linéaire L’ dans 
l’espace 3)' des distributions : 

(L'(T), cp) = (T, L (cp)), cp C 


Dérivotion des distributions 

Les distributions étant une généralisation 
de la notion de fonction régulière, essayons 
d’étendre aux distributions la notion de 
dérivation. Pour cela, analysons tout 
d’abord les propriétés des opérateurs de 
dérivation partielle pour les fonctions 
continûment dérivables 'dans un ouvert* U 
de R*. 

Pour toute fonction cp E 3)(Q), on a, si 
T désigne à la fois une fonction continû- 
ment dérivable dans et la distribution 
qu’elle définit : 


( ffl \ P dT 

V dxj * ^ / x ÔXj 


(*)qp (x)dx, 

* = (*!> 


i '"I x n ^ ; 


mettant en évidence la variable Xp on peut 
écrire (en permutant les variables) x = (x’. 


Xj), d’où dx = dx’ dXj, ce qui donne, par 
intégration par parties, 

{^/ v )=S dx 'l^ x '- x ^ (x '’ x - )dx ' 

= -\ dx '\ T(x) S-f )dx ' = -( T ’ë-} 

Or, l’opérateur L = — (d/dxj) est 
séquentiellement continu dans 3)(Q) (cf. 
supra , Morphismes) ; l’opérateur trans- 
posé, noté d/ôxj est donc un opérateur 
séquentiellement continu de 3)'(0) qui 
prolonge la dérivation au sens usuel. Pour 
toute fonction cp de 3)(Q), laj-ième dérivée 
partielle de la distribution T donne donc 
par déjnition \ 



Ainsi, par exemple, la distribution déri- 
vée de la distribution de Dirac en a sur la 
droite est telle que (5' a , cp) = cp'(a). 

support 

Si Q' est un ouvert contenu dans Q, on a 
un morphisme naturel 

p : B(O') — 3) (O), 

qui à toute fonction cp E 3)(Q') associe la 
fonction p{ cp) obtenue en prolongeant cp 
par 0 en dehors de Q'. L’opérateur trans- 
posé de p est l’opérateur p ’ sur les distri- 
butions défini par : 

( P '(T), cp) = ÇT,p (cp)), T e ffl'(O), cp G a>(D') ; 

p ’ (T) est généralement noté Tq>, restriction 
de la distribution T à l’ouvert Q'. On dit 
que T est nulle sur Q' si Tq. = 0. 

Si T est une distribution dans un ouvert 
Q, on appelle support de T le complémen- 
taire dans Q de la réunion des ouverts Q' 
sur lesquels T est nulle. Par exemple, le 
support de la distribution de Dirac au 
point a de R" est constitué du seul point a. 
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Produit direct 

Soit Q un ouvert de l’espace R" de la 
variable x, et Q' un ouvert de l’espace 
de la variable y, respectivement. Si T et U 
sont des fonctions continues dans Q et Q' 
respectivement, la distribution T X U 
dans Q X Q' définie par la fonction T(x) 
U (y) satisfait à : 

(T X U, 9) = f f T(x) U (y) <ç(x,y) dx dy 

J J O X O' 


(1) 

= f T(x)dx 

f u (y)<f(x,y)dy 


<Jo 

Jo' 

(2) 

= £u(y)rfy 

£ T(x) <p(x, j>)<£x. 


pour toute fonction cp E 3)(Q X Q'). 

On peut montrer que lorsque T et U 
sont des distributions, si on considère les 
intégrales comme des accouplements 
distributions-fonctions (abus de notation 
signalé plus haut), alors les expressions (1) 
et (2) ont un sens, sont égales, et on peut 
montrer que l’application qui à 
çp E S)(Q X Q') fait correspondre (1) ou 
(2) est une distribution. Cette distribution, 
notée T X U, est appelée produit direct de 
T et U. 


Convolution 

Soit T et U deux fonctions continues et 
intégrables dans R" ; on appelle produit de 
convolution de T et U la fonction définie 
par la formule intégrale 

t * u ( x ) = J T(x— y)\J(y)dy. 

La fonction T * U ainsi définie est telle 
que, pour toute fonction cp de 3)(R tt ), 


(3) (T * U, <p) = J ch; qp(x ) J T(jc — J 1 )U(y ) dy 

= ff T(x)\My) V (x+y)dxdy. 
J x r» 


On montre que, dans certains cas, on 
peut donner un sens à (3) pour des 


distributions T et U, et définir ainsi une 
distribution, notée T * U. Cela est possi- 
ble, par exemple, si l’une des distributions 
est à support compact. Sur R, on peut 
également définir le produit de convolli- 
tion de deux distributions S et T qui 
s’annulent pour t < 0. 

L’intérêt pratique de la convolution est 
que de nombreuses opérations usuelles 
sont des convolutions. Par exemple, pour 
toute distribution T sur R rt et pour tout 
multi-indice Q : 



où ô 0 est la distribution de Dirac à l’origine 
des coordonnées. On voit l’intérêt de 
l’étude des équations de convolution, du 
type A * X = B, où A et B sont des 
distributions connues ; la résolution d’une 
telle équation est parfois appelée « décon- 
volution ». Si A est une distribution à 
support compact, on appelle solution élé- 
mentaire de A toute distribution E telle que 
E*A = A*E = Ô 0 ; une solution élé- 
mentaire d’un opérateur différentiel 

'(É)-Z-(É)' 

\a\ ^ m 

est alors par définition une solution élé- 
mentaire de la distribution A = P(d/ 

&c)6, . 


4. Séries et intégrales de Fourier 

La plupart des grandes théories de l’ana- 
lyse classique s’étendent aux distributions ; 
nous nous limiterons ici à des indications 
rapides sur la théorie de Fourier (cf. 
analyse harmonique) en renvoyant à l’arti- 
cle calcul symbolique pour la transforma- 
tion de Laplace. 
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Transformation 

de Fourier dans l’espace S 

Le domaine naturei de Ta transformation 
de Fourier éiémentaire est T’espace S des 
fonctions indéfiniment dérivabies à 
décroissance rapide ainsi que toutes ieurs 
dérivées : c’est T’espace des appiications cp 
indéfiniment dérivabies de R" dans Te 
corps C des nombres compiexes teiies que : 

ll<pJ*,/= sup (1 +||x|| 2 ) / <Ç(x) < «>, 

jeu* \\oxJ 

pour tout entier l et tout muiti-indice k. Cet 
espace S (R") est une e.v.s. pour Ta notion 
suivante de suites convergentes : par défi- 
nition, une suite (cp„) de fonctions de S tend 
vers 0 si : 

r 

Il <P« il*./ - ^0, pour « 

queis que soient F entier /et Te muiti-indice k. 

Pour cp (r S(R W ), on appeiie transfor- 
mée de Fourier de S, Ta fonction : 

<p(w), U = (u „ « 2, G R", 

définie par Ta formuie intégraie : 

= J qp {x)e~ i<x > u> dx, 

ou < x , u > = U\X\ + U 2 X 2 + + U n X n 

désigne Te produit scaiaire dans R”. Cette 
définition de Ta transformation de Fourier 
n’est pas universeiie ; certains auteurs pré- 
fèrent prendre par exempte : 

qp(tt) = J (p(x)e~ 2Jn <x ’ u > d: c, 
ou cp(w) = J cp (x)e i<x ’ u> dx, ... 

On passe d’une définition à F autre par 
un simpie changement de variabie dans 
F intégraie définissant (p, Nous écrirons 
tout ce qui suit avec Ta convention indi- 
quée, adoptée par de nombreux mathéma- 


ticiens qui étudient Tes équations aux 
dérivées partieiies. Dans Farticie anaiyse 
harmonique, au contraire, on préférera 
adopter Ta seconde formuie. 

L’appiication 5^ qui à cp fait correspon- 
dre sa transformée de Fourier <p possède 
Tes principaies propriétés suivantes : 

u) la fonction cp est dans S et 

F :S^S 

est un isomorphisme de Fe.v.s. S sur 
lui-même ; 

b) pour tout couple de fonctions cp et \p 
de S, on a les formules : 

qp(x)ip(x)ûfx = J <p(x)ip(x)</x 

(relation de Parseval), 

J <p(x) ip(* )dx= (2 TT) J (ç(u ) i v(u ) du 

(relation de Plancherel) ; 

c) l’isomorphisme réciproque de l’iso- 
morphisme S*" est défini par : 

cp(x ) = (2 tt) ~ n Jp*(u )e i<x ’ u> du 
(formule d’inversion de Fourier). 

Transformation 
de Fourier dans S’ 

On appelle distribution tempérée dans R" 
toute forme linéaire séquentiellement 
continue sur S ; remarquons que, puisque 
l’application identique de D(R”) dans 
8(R”) est un morphisme et que toute (p de 
S est limite d’une suite d’éléments de Ü), la 
transposée de cette application identique 
est une injection. Cette injection fait appa- 
raître l’espace S’ des distributions tempé- 
rées comme un sous-espace vectoriel de 
l’espace vectoriel 3)' des distributions. 

Par définition, on appelle alors trans- 
formée de Fourier d’une distribution tem- 


283 



DISTRIBUTIONS 


pérée T la distribution tempérée T définie 
par : 

(f, cp) = (T,cp) } (p G 8. 

Considérons par exemple la distribu- 
tion sur R définie par la fonction x ; sa 

transformée de Fourier x est telle que : 

(x,cp) = (x, <p) = J uy(u)du ; 

un calcul facile montre que cette dernière 
intégrale vaut : 

— 2 i 7rcp , (0) = 2 / 7r(5'o, cp), 

où ô'o est la dérivée (au sens de distribu- 
tions) de la distribution de Dirac en 0. 
Ainsi x = 2 i TTÔ'q. Par des raisonnements 
analogues, on pourrait montrer que la 

distribution : 

oc 

T = V 6, 

n = — 06 

a pour transformée de Fourier : 

00 

T = 2 Tt ^ ^ 5^ jf , 

n — — 00 


correspondance naturelle entre les fonc- 
tions définies sur le tore T et les fonctions 
périodiques de période 2n définies sur R. 
Par définition, on dit qu’une fonction défi- 
nie sur T est indéfiniment dérivable s’il en 
est ainsi pour la fonction périodique asso- 
ciée ; l’espace 3>(T) des fonctions indéfini- 
ment dérivables sur T est alors muni d’une 
structure d’e.v.s. en convenant qu’une suite 
(cpj tend vers 0 dans 9(T) pour n — ► oo, si 
(d/d 0)* cp rt tend uniformément vers 0 sur T, 
n —+ oo, pour tout entier k. 

Par définition, une distribution sur T est 
alors une forme linéaire séquentiellement 
continue sur 5) (T) ; il est facile de voir que 
l’espace 9’ (T) de ces distribution est en 
correspondance bijective avec l’ensemble 
des distributions périodiques sur R, c’est- 
a-dire les distributions T telles que : 

(T, q(x)) = (T, <P(* — 2 TT)), cp G 3)(R). 

En procédant comme ci-dessus, on peut 
définir des opérations dans 3) '(T) ; déri- 
vation, produit direct, convolution, etc. Si 
fest une fonction intégrable définie sur T, 
elle définit la distribution : 


ce qui est équivalent a la relation de 
Poisson, 


£ 7(6) 9(6) 


de 

2tï 


Par définition, on appelle transformée 
de Fourier d’une fonction cp G 3)(T) la 
suite doublement infinie cp = ((p 4 - )_«=</? <=*= 
valable pour toute fonction cp G S (R). définie par : 


r w r 7 

^ <?(n) = 2 rr ^ 


tp (2 ir n ), 


Coefficients de Fourier 
d'une distribution périodique 

Comme d’habitude, on identifiera le tore 
T = R/ 2 ïïZ (quotient de R par la relation 
d’équivalence Jt — y six y est un multiple 
entier de 2 7r) à la circonférence unité du 
plan complexe, tout point de cette circonfé- 
rence étant caractérisé par son affixe e iQ , ou, 
ce qui revient au même, par son abscisse 
curviligne 0. Cette identification établit une 


kez. 

Jq 2 tt 

Pour développer une théorie similaire à 
celle de la transformation de Fourier vue 
ci-dessus, on est conduit à introduire 
l’espace vectoriel s des suites doublement 
infinies à décroissance rapide, c’est-à-dire 
les suites a = telles que : 

Kll) = sup(l+ |* |)'|fl*| < «, 
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pour tout entier / ; cet espace est un e.v.s. 
si on convient qu’une suite (a {n) ) d’élé- 
ments de s tend vers 0 si pour tout entier 
/ la suite | | / tend vers 0 pour n — ► oo. 

On montre alors que l’application $ 
définie par S^cp) = (p est un isomorphisme 
de 3)(T) sur l’espace s , l’application 
inverse faisant correspondre à la suite 
a = (a,) la somme de la série de Fourier : 

+ » 

<p(6) = 

k = — » 

La relation de Plancherel prend ici la 
forme : 

+ °° 

J o ‘ <p(ô)ip(6)^| = ^ 9* 'î 1 -*. 

* = — «> 

cp, y G S)(T) : 

elle montre que la transposée de î" 1 est un 
isomorphisme de W(T) surs’ qui prolonge 
5 r . Si on note encore & cette application 
transposée T ► T, on a : 

+ CC 

(î. <p) = ^ ; 

k = — « 

en particulier, si on fait cp(0) = e lkQ , on 
obtient : 

fi = (T, e~ ikQ ). 

On peut caractériser l’espaces’ des trans- 
formées de Fourier des distributions tempé- 
rées ; c’est l’ensemble des suites T = (T,) à 
croissance lente, c’est-à-dire pour lesquelles 
il existe un entier / (dépendant de T) tel que 
T k /k l reste borné pour k | — ► oo. 

Une application 

Les distributions peuvent servir à étudier 
le comportement des fonctions analyti- 
ques ; voici un exemple simple d’une telle 
situation. 


À une distribution T sur le tore, asso- 
cions le couple lo = Tj~) des deux 

fonctions holomorphes ainsi définies : 

50 

E + (z) = T k z k si I z < 1, 

k = 0 
-I 

s-(z) = ^ f k z k si | z > 1. 

k = — * 

Soit maintenant P(0) un polynôme 
trigonométrique, c’est-à-dire une combi- 
naison linéaire finie d’exponentielle e lke : 

P(0)= ^P*e*<>; 

1*1 < N 

on peut écrire aussi, par abus de notation : 

P(z) =£p t z*. 

Soit C + et C _ deux circonférences 
de centre 0 et de rayons < 1 et > 1, 
orientées dans le sens rétrograde et dans le 
sens trigonométrique respectivement. 
Développant U et P en série, on obtient 

(ftg- 2) : 
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wAc Hz)mdz = 

* =0 

-1 

k = — * 

donc : 

(4) (T, P) =yr— f B(Z)P (z)rfz. 

Il TT Jc+ uc- 

Pour 0 < r < 1, posons maintenant : 

3 Ç 

T.-K8) = TS+ire*) = ^ t t r k e'* e 

*.0 

T7(0) = t5-(^)= ^ Vy* 6 ; 

k = —*> 

ainsi, on a : T r + — T~ = P r * T, 

OÙ : P r (Ô) = 

k = 

est le noyau de Poisson. On peut voir que 
P ; tend vers ô 0 dans W(T) pour r — ► 1 ; il 
en résulte que l’on a dans W(T) : 

T = üm (V-T~). 

r—l 

On interprète le résultat précédent 
en disant que la distribution T est la 
différence des valeurs au bord (le long de 
la circonférence unité) des fonctions holo- 
morphes et Par exemple, consi- 
dérons : 

E(z) = 1 — > N entier positif. 

Développant TS en série entière (en z ou 
en 1/z), on voit que à T> est associée une 
distribution T N dont les coefficients de 
Fourier sont : 

0, si k n'est pas un multiple de N, 

1, si k est un mutiple de N ; 


la formule (4) ci-dessus montre alors 
que pour tout polynôme trigonométrique 
P : 

(t n , p) = y p( z n)’ avec z; n = 

Si bfa désigne la mesure de Dirac sur T 
concentrée au point ^ on a donc : 

(Tn, P) = (ô j n- P> : 

/ri 

comme toute fonction de B (T) est appro- 
chable uniformément par une suite de 
polynômes trigonométriques, on en déduit 
que T n est la somme de la série : 

Tn=JV n . 

; = o 

De manière générale, toute suite dou- 
blement infinie (â k ) kez , à croissance lente 
(cf. supra , Coefficients de Fourier d'une 
distribution périodique ), est la suite des 
coefficients de Fourier d’une distribu- 
tion A sur T, ce qu’on écrit symbolique- 
ment : 

+ °° 

A(6)~ 

k = —oo 

de plus, A est la limite dans W(T) des 
distributions définies par les polynômes 
trigonométriques : 

Autrement dit. la série de Fourier d’une 
distribution converge vers cette distribu- 
tion dans B’ (T) ; mais bien entendu cela 
n’entraîne pas que les sommes partielles 
convergent pour tout 0. 

PAUL KRÉE 
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DIVISIBILITÉ 


L ? étude élémentaire de la divisibilité 
dans l’anneau Z des entiers relatifs 
résulte de l’existence de la division eucli- 
dienne qui entraîne que cet anneau est 
principal. Les propriétés générales des 
anneaux principaux sont exposées dans 
l’article anneaux commutatifs, et nous 
nous contenterons ici d’énumérer les prin- 
cipaux résultats relatifs au cas particulier 
qui nous occupe ici. 

L’étude plus fine et plus spécifique de 
l’anneau Z (nombre de diviseurs d’un 
nombre donné, somme de ces diviseurs, 
etc.) introduit des fonctions arithmétiques 
multiplicatives. Les indications qui suivent 
sont très élémentaires, mais il est impor- 


tant de noter qu’un grand nombre des 
résultats obtenus ont été généralisés aux 
corps de nombres algébriques ; le dernier 
chapitre donne un aperçu de ces propriétés 
dans le cas des corps quadratiques, en 
renvoyant à l’article théorie des nombres - 
Nombres algébriques pour l’exposé de la 
théorie sous sa forme contemporaine. 


1. Propriétés élémentaires 

L’anneau Z des entiers relatifs possède la 
propriété suivante de division euclidienne : 
si a et b sont deux entiers relatifs, b 7^ 0, 
il existe des entiers g et r déterminés de 
manière unique par les conditions : 

a = bq -f r, 0 < r < 6 — 1; 

q s’appelle le quotient de la division de a 
par b et b est le reste de cette division. Si 
le reste est nul, cela signifie qu’il existe 
un entier q tel que a = bq ; on dit alors 
que b divise a, ou que a est un multiple 
de h. 

Dans ce qui suit, nous nous limiterons, 
sauf mention explicite du contraire, aux 
entiers positif. On écrit b a si b divise a. 
Cette relation de divisibilité est une rela- 
tion d’ordre dans les entiers naturels ; en 
effet, elle est réflexive car a a, transitive 
car c b et b a entraînent c a , antisymé- 
trique car a b et b a entraînent a = b. 
Cet ordre n’est pas total car deux entiers 
a et b ne vérifient pas obligatoirement l’une 
des relations a \ b ou b | a. Un nombre 
p zjL 1 est dit premier s’il n’est divisible que 
par 1 et par lui-même. 

Soient a et b deux entiers positifs ; on 
montre (Cf. anneaux commutatifs) qu’il 
existe un diviseur commun d de a et de b 
tel que les diviseurs communs de a et de b 
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soient exactement les diviseurs de d ; ce 
diviseur commun privilégié est appelé le 
plus grand commun diviseur (en abrégé 
P.G.C.D.) de a et de b et se note d = ( a , 
h). Si (a, b) = 1, c’est-à-dire si le seul 
diviseur commun de a et de b est 1, on dit 
que a et b sont premiers entre eux. Une 
condition nécessaire et suffisante pour 
que a et b soient premiers entre eux est 
qu’il existe des entiers relatifs x et y tels 
que : 

ax + by = 1 (identité de Bezout). 

Ce résultat entraîne facilement le 
lemme de Gauss : si un entier c divise un 
produit ah et est premier avec a, alors il 
divise b. On en déduit le théorème fonda- 
mental de la décomposition en facteurs 
premiers : tout entier naturel a > 1 est 
décomposable, d’une manière unique, en 
un produit : 

a = p x k ip 2 kï ... p n kn 

de nombres premiers p\,p 2 ,- ■ ->Pn distincts ; 
les exposants k, sont des entiers ^ 1. On 
peut, à partir de là, donner la règle 
d’obtention du P.G.C.D. de nombres ainsi 
décomposés : prendre les facteurs pre- 
miers communs avec les exposants les plus 
petits. On peut aussi bâtir sur ces décom- 
positions la théorie du plus petit commun 
multiple (en abrégé P.P.C.M.) de deux 
nombres : prendre les facteurs premiers, 
communs ou non, avec leurs exposants les 
plus grands. Le P.P.C.M. ainsi introduit de 
a et 6 est un multiple commun m tel que 
les multiples communs de fl et de b soient 
exactement les multiples de m ; il est relié 
au P.G.C.D. d de a et de b par la relation 
md - ub. 

Indiquons enfin que les notions de 
P.G.C.D. et de P.P.C.M. s’étendent sans 
difficulté au cas de n entiers flj, a,, . . . . a,. 


2. Fonctions arithmétiques 
Congruences 

On se placera ici dans l’anneau Z des 
entiers relatifs. On dit que a est congru à b 
(modulo m ), ce qui s’écrit a = b (mod m), 
lorsque m (u-b). Cette congruence 
modulo m, pour m fixé, est une relation 
d’équivalence (réflexive, transitive, symé- 
trique) et permet donc de faire une parti- 
tion de Z en classes (ensemble quotient par 
cette équivalence). Chacune de ces classes 
est appelée classe résiduelle modulo m , et 
comprend un élément et un seul a compris 
entre 0 et (m — 1), soit 0 ^ a ^ m 1, tel 
que tout autre élément de la classe est égal 
à a + km. Si l’on désigne par [b],, la classe 
d’un entier b, il y a ainsi m classes, à savoir : 
[OI, [1],„, [2]„„ .... [m - l] m . On dit que m 
nombres b„ b-,, ■ . . ■ b,,, forment un système 
complet de résidus, modulo m , si ces nom- 
bres sont, deux à deux, non congrus 
modulo m ; ils correspondent donc aux m 
classes. La congruence modulo m étant 
stable dans l’addition et dans la multiplica- 
tion, on peut munir l’ensemble des classes 
résiduelles des opérations de somme et de 
produit (avec [a],„ + [b], = [a -f- b], et 
M„, X [b],, = [ab],). On obtient ainsi un 
anneau Commutatif (Cf. ANNEAUX ET ALGÈ- 
bres), dans lequel [ax\ m = [ay] m entraîne 
Mm = Mm si a est premier à m ; dans le cas 
général, on n’aurait que [.x] m/rf = Mm/d 
avec d = (u, m). Un cas particulièrement 
intéressant est celui où m = p est premier ; 
dans ce cas, en effet, l’anneau des classes 
résidueiies devient un corps, qu’on écrit en 
général Z//?Z ou Zjp. En effet, si [a], ^ 0, 
donc a non multiple de p , c’est-à-dire a 
premier avec p , on peut écrire 

ab + pc = 1, d’où [a\ p [b] p = [1]^, ce qui 
montre l’existence de 1 / [a], = [ b ] p . Cela 
rejoint d’ailleurs une propriété classique : 
tout anneau fini sans diviseur de 0 est un 
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corps. D’autre part, il est facile de voir que 
[a],, = [b\ m équivaut à (a, m) = (b, m) \ on 
peut donc envisager les classes résiduelles 
premières à m qui forment, pour m donné, 
ce qu’on appelle un système réduit (par 
exemple, pour m = 18, les classes [ 1], [5], 
[7], [11], [13] et [17]). On dit alors qu’un 
ensemble d’entiers est un système réduit de 
résidus modulo m , si un et un seul de ces 
entiers appartient à chacune des classes 
d’un système réduit. Pour m — p premier, 
toutes les classes sauf [0] forment un sys- 
tème réduit, comprenant (/; 1) éléments. 

Dans le cas général de m quelconque, le 
nombre d’éléments d’un système réduit est 
égal à celui des nombres compris entre 1 et 
m et premiers à m. Ce nombre s’appelle 
rindicateur d’Euler de m, désigné par c p(m), 
et l’on peut établir les conditions nécessai- 
res et suffisantes suivantes pour qu’un 
ensemble de nombres soit un système 
réduit de résidus modulo m : ce système 
comprend (ç(m ) éléments ; ces éléments 
sont deux à deux non congrus modulo m ; 
chaque élément est premier à m. Il est 
alors évident que, si l’on multiplie 
chacun de ses éléments par un même 
facteur premier à m , on transforme un 
système réduit de résidus en un système 
réduit. 

Fonctions arithmétiques classiques 

La fonction cp d’Euler est une fonction 
arithmétique multiplicative ; on appelle 
ainsi toute fonctionf 1 définie sur les entiers 
naturels, et telle que f(ab) = f (a) f (b) 
lorsque (tf, b) = 1. On établit sur les 
fonctions arithmétiques multiplicatives 
l’important théorème suivant : si f est 
arithmétique multiplicative et si l’on pose : 


alors F est aussi multiplicative, et récipro- 
quement. 

De plus, on a : 

«/in 


1, si d= 1; 

u(^) = s i d codent des facteurs canes ; 

(- l) v , si d = P\Pi . produit de 
. nombres premiers distincts. 

Cette fonction p s’appelle fonction de 
Môbius ; elle est aussi multiplicative. La 
relation de réciprocité liant / à F, grâce à 
cette fonction de Mobius, reste d’ailleurs 
valable dans le cas de fonctions non 
multiplicatives ; elle s’établit par simple 
calcul, et fournit la démonstration la plus 
simple du fait que f est multiplicative si F 
l’est. L’implication en sens contraire est 
beaucoup plus simple à établir ; elle résulte 
de ce que tout diviseur d’un produit de 
deux nombres premiers entre eux est le 
produit d’un diviseur de l’un par un 
diviseur de l’autre. 

On établit donc que la fonction cp 
d’Euler est arithmétiquement multiplica- 
tive, soit en la mettant sous la forme : 


cp (m) = m 



car c’est : 


Z m V' m V* m 

h / / h 

Pi L-jPiPj L^PiPjPk 

où les Pi sont les facteurs premiers de m ; 
soit aussi en considérant les nombres de la 
forme ax + by qui sont premiers à ah 
(système réduit de résidus, modulo ab). 

Si l’on envisage alors : 


F(«)= ^f(d), 

d\n 


$(m) = 


'y 

d | m 
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on a une fonction multiplicative qui, par 
simple calcul, donne <î>(p a ) = p a , donc 
<P(m) — m pour tout m. Cela établit la 
formule classique : 

^ <P(<0 = m, 

d\m 

qui peut aussi se démontrer en rangeant 1, 
2, 3, ... . m en classes C^, comprenant les 
nombres dont le P.G.C.D. avec m est d; 
il y a cp (m/d) nombres dans C rf , d’où la 
formule précédente, par simple décompte. 

La formule de réciprocité de Mobius, 
appliquée à : 

y <pw = m > 

d\m 


donne alors : cp (m) = m 

d\m 

Deux autres fonctions multiplicatives 
sont classiquement attachées à la fonction 
cp d’Euler ; il s’agit de r(n) =nombre des 
diviseurs positifs de n (1 et n compris) et 
o(n) = somme de ces diviseurs. La multi- 
plicativité de ces deux fonctions découle 
encore de ce que, si a et b sont premiers 
entre eux, tout diviseur de ab est le produit 
d’un diviseur de a par un diviseur de b. 
Comme : 


V -1 ù(<0 

2-, d 


t (p a ) = a + 1 et o(p a ) = 


2 a + 1 — L 


il vient : 


et 


t (n) = n(a,- + 1) 

1 

Pi — 1 

où : n =p*'Pi‘ -p"'- 


a(n) = JJ 


Â noter la relation 


$>-£[*:]• 

1 1 

où la quantité entre crochets représente ici 
la partie entière de k/n. 


Nombres parfaits 

On appelle nombre parfait un nombre tel 
que o(n) = 2n, et on a établi que tout 
nombre parfait pair s’écrit sous la forme : 

n = 2 p~ 1 {2p — 1), 

avec p et (2 P ™ 1) premiers (Euclide avait 
déjà étudié sous cette forme les nombres 
parfaits). On ne sait pas, actuellement, s’il 
y a ou non des nombres parfaits impairs. 
Les nombres parfaits pairs sont donc liés 
aux nombres premiers de la forme 2 P ™ 1. 
Ces nombres sont appelés nombres de 
Mer senne (Mersenne affirma en 1644 que, 
jusqu’à p = 257, 2 P — 1 était premier 
seulement sip = 2, 3, 5, 7, 13, 17, 19, 31, 
67, 127 et 257). On a établi, depuis, que 
cette liste contenait des erreurs et des 
omissions : jusqu’à 5 000, (2 P 1) est 

premier pourp = 2, 3, 5,7, 13, 17, 19, 31, 
61, 89, 107, 127, 521, 607, 1279, 2 203, 
2281, 3 217, 4253 et 4423. Fermât, de 
son côté, avait conjecturé que les nombres 
de Fermât : 


F „ = 2 2 " + 1 

étaient tous premiers. Euler en 1732 établit 
que F 5 était composé (divisible par 641), 
Legendre en 1780 établit que F 6 est 
divisible par 274 177. On a établi, depuis, 
que F n est non premier pour 7 n ^ 16 
et n ™ 18, 23, 36, 38, 39, 55, 63, 73, ; 
et on ne connaît explicitement aucun F n 
premier pour n > 4. Les nombres de 
Fermât premiers jouent un rôle essentiel 
dans !a recherche des polygones réguliers 
de m côtés que l’on peut construire avec 
la règle et le compas (Gauss, âgé de 
dix-sept ans, établit qu’une condition 
nécessaire et suffisante pour que cette 
construction soit possible est que m soit un 
produit de nombres de Fermât premiers 
distincts). 
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3. Théorèmes classiques 

Théorème d'Euler-Fermat 

Euler établit, en 1760, le théorème d’Euler- 
Fermat, suivant lequel, si m est entier 
naturel, et (a, m) = 1, on a : 

a^m) = i (mod m ). 

En effet, un système réduit de résidus 
modulo m , soit r { , r 2 , . . . . est trans- 
formé, on Ta vu, en un système réduit par 
multiplication par a ; donc ar j, É/r 2 , 
ar y{m) son C modulo m, égaux à une 
permutation de r j, r 2 , .... r (p(m) d’où le 
produit : 

û^V,r 2 r <p (m) = r i r 2 . . . r^ im) (mod m), 

que l’on peut simplifier par rj r 2 
premiers à m. D’où la formule d’Euler- 
Fermat. Fermât avait établi en 1736 ce 
théorème dans le cas particulier de m = p 
premier. Il s’agit du « petit théorème de 
Fermât », suivant lequel : 

aP~ l = 1 (modp), 

si a n’est pas multiple dep. On l’écrit, sans 
condition sur a , sous la forme a p = tf(mod 
p). On remarquera que la réciproque de ce 
théorème n’a pas lieu (par exemple 
m = 561 = 3 X 11 X 17 vérifie, pour 
tout a premier à m, a 560 = 1). On a d’autre 
part établi (Beeger en 195 1) qu’il existe une 
infinité d’entiers n pairs tels que 2 n 2 est 
divisible par n (le plus petit de ces nombres 
étant 161 038). 

Théorème de Wilson 

Le théorème de Wilson énonce que : 

{p — 1) ! = — 1 (mod/?), 

pour tout p premier (théorème publié en 
1770 par Waring et démontré par 


Lagrange en 1771). Supposant p impair et 
développant : 

(x — 1) (x — 2) ... (x —p + 1) 

= xp ~ 1 — A tXP ~ 2 + + A /> _ 1 , 

Lagrange obtient, après avoir multiplié par 
X puis changé x en (x- 1), une identité 
permettant d’établir que p A„ p A„ ..., 
p\A p 2 et (p — 1 ) Ap_i = 1 (modp).Ona 
donc A ;) _i = — I (modp), ce qui établit le 
théorème, car A^j = (p — 1) !. On a de 
plus : 

xp-' — \ =(x—l)(x — 2) 

. ..(*—/?+ 1) (mod/?), 

ce qui, pour x premier à p y donne le petit 
théorème de Fermât. On verra une autre 
démonstration du théorème de Wilson, 
dans le paragraphe des résidus quadrati- 
ques. 

Racines primitives 

La notion de racine primitive modulo ni, 
est liée à la formule d’Euler : 

a <v(m) = 1 (modm). 

Soit en effet k le plus petit exposant 
pour lequel a p = 1 (mod m). On dit que a 
appartient à l’exposant k (mod m ), OU que 
k est Tordre de a, modulo m. Il s’ensuit que 
k divise tout x tel que a x = 1 (mod m) ; en 
particulier, k cp ( m ), et on dit que a est une 
racine primitive modulo m si l’ordre de a 
est <p(m), c’est-à-dire si c p(m) est effective- 
ment le plus petit exposant pour lequel 
a p = 1 (mod m). Cette définition montre 
que tout entier congru, modulo m , à une 
racine primitive, en est également une. Ces 
racines primitives ont l’importante pro- 
priété que, pour chacune d’elle, a par 
exemple, les nombres a, a 2 , a 3 , ... . 
forment un système réduit de résidus. On 
démontre que tout p premier possède des 
racines primitives ; il y en a exactement 
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cp(p — 1) distinctes entre elles, modulo p. 
Cela découle d’un théorème assez surpre- 
nant suivant lequel, si p est premier, et 
d (p - — 1 ), il y a exactement cp (d) nombres 
non congrus 2 à 2 et dont l’ordre est d 
(modulo p) ; le nombre des nombres 
d’ordre d (modulo p) ne dépend donc pas 
de p, dès que cf divise ( p 1). Pour 

l’existence des racines primitives modulo 
m , avec ffl non premier, l’étude, plus 
délicate, fut faite par Gauss, qui établit que 
ces racines primitives n’existent que si 
m = 2, 4 ou p k ou 2p k (P premier impair 
quelconque). 

4. Résidus quadratiques 

Résidus et non- résidus 

Un nombre a premier à m est dit résidu 
quadratiqur de ni , si x 2 = a (mod m) a des 
solutions entières en x ; sinon a est dit 
non-résidu quadratique (avec toujours la 
condition a premier à m). Dans le cas où 
flfl = p premier, il est facile de voir qu’il 
existe, modulo p, (p — l)/2 résidus qua- 
dratiques et (p — l)j 2 non-résidus ; en 
effet, l 2 , 2 2 , {p — l) 2 donnent, modulo 
p, (p — l)/2 classes résiduelles différentes ; 
car (p — q) 2 = q 2 et a 2 — b 2 — (a- h) 
(a -|- b) = 0 (modp) si a et b sont au plus 
égaux à (p — l)/2. Par exemple, pour 
p = 11, on a les résidus quadratiques 1, 3, 
4, 5 et 9. On peut établir aisément, pour 
m quelconque, que le produit de deux 
résidus quadratiques de m est un résidu ; 
car x 2 = a et y 2 = h cntrzintJviÿ} = ah 
(mod m). Dans le cas où m = p premier, 
le produit d’un résidu par un non-résidu 
est un non-résidu et le produit de deux 
non-résidus est un résidu ; il suffit pour 
cela d’envisager a, 2 a, 3 a, .... (p 1 )a, 
qui sont non congrus modulo p, donc 
forment un système complet (mod p). Il y 


a donc (p — l)/2 résidus et (p — l)/2 
non-résidus, quel que soit a premier à p, 
et, si a est résidu, les (p — l)/2 résidus 
proviennent du produit par a des résidus 
quadratiques de p, donc les (p l)/2 
non-résidus correspondent aux produits de 
a par les non-résidus de p. Si a est 
non-résidu, les (p — l)/2 non-résidus pro- 
viennent donc du produit de a par les 
résidus quadratiques de p, donc les 
(p — l)/2 résidus correspondent aux pro- 
duits de a par les non-résidus de p. Pour 
m quelconque, cependant, on peut avoir le 
produit de deux non-résidus qui soit un 
non-résidu : par exemple, pour ffî = 45, 
les résidus quadratiques sont 1, 4, 16, 19, 
31, 34, et 2 X 7 ™ 14. Un critère d'Euler 
établit que, pour p premier différent de 2, 
a est résidu ou non-résidu quadratique de 
p suivant que, respectivement, 

a (p -b /2 = 1 (modp) 
ou : a “*) /2 = — l(modp); 

on ne peut avoir que l’une ou l’autre de ces 
congruences puisque a p ~ 1 = 1 (modp). On 
peut, à partir de ce critère, retrouver les 
théorèmes concernant les produits de rési- 
dus ou non-résidus (mod p). 

Loi de réciprocité 

Legeîldre a introduit un symbole qui porte 
son nom : pour p premier, 



si a est résidu ; 



si a est un non-résidu. On a donc : 

(?)■ - (?)(!)• 
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Ce symbole permet d’exprimer un 
important théorème connu sous le nom de 
loi de réciprocité quadratique. Cette loi fut 
prouvée par Euler en 1783, retrouvée par 
Legendre en 1785 et mise au point par 
Gauss en 1808 ; elle s’écrit, pour deux 
premiers impairs distincts p et q, SOUS la 
forme : 


p - i 


Ç~1 

2 


En d’autres termes les congruences 
-V 2 = p (mod q) et >’ 2 = q (mod p) sont 
résolubles ensemble, ou non, sauf si 
p = q = 3 (mod 4), auquel cas une et une 
seule de ces équations est résoluble. Le 
symbole de Legendre a été étendu par 
Jacobi, qui définit 

\pxPi.'.p„) \pxJ\piJ \p n J 

les nombres premiers p- étant distincts ou 
non. Ce symbole, toutefois, a l’inconvé- 
nient d’être égal à + 1 sans que a soit 
toujours résidu quadratique modulo p [ p 2 
p n ; par exemple : 

(ï)-(ï)(j) 

vaut toujours -(- 1. On peut cependant 
établir, pour a et b premiers entre eux, que 



entraîne que a est non-résidu quadratique 
modulo b. Signalons enfin que le théorème 
de Wilson : (p — 1) ! = — 1 (modp), établi 
antérieurement, se démontre à partir 
des résidus : pour p premier impair et 
pour a non multiple de p } on peut établir 
que : 

(p — 1 ) ! = _(?) <fr (mod p) ; 


il suffit, pour cela, d’associer les couples x 
et (p — x) et de voir que, deux à deux, on 
a x'x" = a (mod p) ou bien, si a est résidu, 
X 2 = a et (p — X i)Xj = -a (modp) et 
x'x" = a (mod p) pour les autres. Les 
résidus quadratiques sont utilisés en par- 
ticulier dans la théorie des corps quadra- 
tiques, dans la factorisation des nombres 
(par exemple, si N = x 2 + ky 2 , avec x et 
y premiers entre eux, -k doit être résidu 
quadratique de tous les facteurs premiers 
de N, ce qui facilite la factorisation), et 
aussi dans la recherche des carrés parfaits 
dans le corps Q /; des nombre sp-adiques. À 
côté de la recherche directe, par dévelop- 
pements de Hensel, l’introduction du sym- 
bole de Hilbert (a, ( 3 ), égal à -f* 1 ou — 1 
suivant que ax 2 + (3y 2 — z 2 = 0 est réso- 
luble ou non dans Q„, conduit à la carac- 
térisation des carrés a par le fait que 
(a, P) = 1 pour tout p. 


5. Divisibilité 

dans les corps quadratiques 

On ne donnera ici qu’un aperçu de la 
théorie de la divisibilité dans les corps 
quadratiques. Si l’on considère les nom- 
bres de la forme : 

u + vVd 
w 

ou d est entier non carré parfait, et W, V, w 
entiers relatifs (avec vt’ ^ 1), on définit un 
corps, appelé corps quadratique Q (V^/). 
Dans ce corps, on appelle entiers les 
éléments qui vérifient une équation du type 
a 2 -f- a x a + a 2 = 0, a, et a 2 étant des 
entiers ; et on démontre que ces entiers 
sont donnés par les formules : 

a -f bVd , si d = 2 o u 3 (mod 4) 
et a + b — - ? s i d = 1 (mod 4). 
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Ces entiers forment un sous-anneau de 
Q ( VJ ), et on peut définir dans cet anneau 
la divisibilité, compliquée par le fait qu’il 
existe d’autres unités que + 1 ou 1. Une 
unité quadratique est en effet racine d’une 
équation : 

a 2 + a j a ± 1 - 0 

Il y a une infinité d’unités dans Q 
(VJ) pour d > 2 et, pour d < — 1, il n’y 
en a pas d’autre possible que 1,-1 ; /, — i 
et les racines troisièmes de l’unité y, y 2 , ~j 
et — y 2 . Une unité divise tout entier; on 
définira donc les nombres premiers 
comme étant ceux qui ne sont divisibles 
que par eux ou par les unités du corps. De 
même, a et b seront dits premiers entre eux 
si leurs seuls diviseurs communs sont les 
unités ; on écrit encore (a, b) = 1 mais 
c’est un symbole car 1 n’est plus le 
P.G.C.D. au sens ordinaire. Sans entrer 
dans le détail, signalons qu’ alors le théo- 
rème de Gauss (a hc et (a, b) = 1 entraî- 
nent a c) peut avoir lieu, ou ne pas avoir 
lieu, suivant d. Lorsque ce théorème a lieu, 
Q ( VJ ) est appelé corps quadratique sim- 
ple ; en découle une décomposition unique 
en facteurs premiers (à des facteurs unités 
près). Par exemple, il en est ainsi pour 
d = ~\,d — 2, d — - 3, mais pas pour 
d = 5 ou d = 10 (on a par exemple : 

6 = 2 X 3 = (4 + V!Ô)(4 — VTÜ) 

et on vérifie qu’il n’y a pas d’unités 
permettant de passer d’une décomposition 
à l’autre). Les seuls cas quadratiques 
simples, pt/urd < 0, sûnt les cas ou 
-d = 1, 2, 3, 7, 11, 19, 43, 67, 163 
(résultat de Stark et Baker en 1966 ; avant 
eux on avait établi qu’il en existait peut-être 
encore un, avec d > 5 X 10 9 ). Une 
autre notion peut s’étendre à Q (VJ) ; il 
s’agit de la division euclidienne, qui fait 
intervenir les normes des nombres quadra- 


tiques, soit N (a) = a a (où a est le 
conjugué de a). Q ( VJ ) est dit euclidien si, 
pour tout a { et a 2 entiers, on peut écrire 
ai = Pa 2 + y avec N(y) < N(a 2 ). La 
propriété Q (VJ) « euclidien » entraîne 
évidemment Q (VJ) « simple », mais pas 
réciproquement. On a démontré que les 
seuls cas euclidiens correspondent à 
d = — 11, — 7, — 3, — 2, — 1, 2, 3, 5, 6, 7, 
11, 13, 17, 19, 21, 29, 33, 37, 41, 57 et 73. 
Le cas d = — 1 est le cas, bien connu, des 
entiers de Gauss a-i- bi où a et b sont des 
entiers relatifs ordinaires. 

MARCEL DAVID 
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ENSEMBLES théorie élémentaire 
DES 


T oute pensée formalisée s’exprime de 
nos jours dans le langage de la théorie 
des ensembles, qui a ainsi envahi toutes les 
disciplines, sciences humaines comprises. 
Dès l’école primaire, l’enfant apprend à 
classer des objets suivant leur forme, leur 
couleur, leur taille, à établir entre eux des 
correspondances, préambules à des mani- 
pulations plus abstraites. 

La théorie élémentaire des ensembles 
fait partie du bagage culturel minimal de 
l’homme contemporain. 

L’algèbre des ensembles n’est pas non 
plus étrangère aux progrès de la technique, 
ne serait-ce que parce qu’elle joue un grand 
rôle en informatique dans la conception et 
la construction des ordinateurs et des 
logiciels ; elle intervient aussi pour une 
large part dans l’organisation de l’infor- 
mation, les techniques de gestion, les 
études de marché. 

Les règles générales de la logique 
d’Aristote ont été, depuis le Moyen Âge, 
l’objet de recherches visant à dégager un 


« langage universel » commun à la logique 
formelle et à l’algèbre. C’est Leibniz qui 
formule le premier la demande, SOUS- 
jacente chez Raymond Lulle, d’un « alpha- 
bet des pensées humaines » permettant de 
réduire à un algorithme symbolique le 
raisonnement déductif. 

Pour Leibniz, sa « caractéristique uni- 
verselle » est un langage formalisé, pure 
combinaison de signes, dont les théorèmes 
ou les propositions se déduiraient de 
manière purement mécanique ( calculus 
raîiodnaîor). En ce sens, il est le précurseur 
de la théorie élémentaire des ensembles. 

Inédits et inconnus jusqu’au début du 
XIX e siècle, les travaux de Leibniz sont 
repris par les logiciens de l’école anglaise. 
C’est G. Boole qui est le véritable créateur 
du calcul direct sur les parties d’un ensem- 
ble. A. de Morgan ( 1858 ), W. S. levons 
(1864) et C. S. Pierce (1867) abordent 
l’étude des relations sur un ensemble. 

En 1890, E. Schrôder, dans un ouvrage 
monumental, fait la synthèse des travaux 
de ses devanciers. A la fin du XIX e siècle, les 
recherches de Frege et de Peano s’articu- 
lent avec les problèmes des fondements des 
mathématiques. 

On ne donnera pas dans cet article une 
construction formelle et rigoureuse de la 
théorie des ensembles, mais on essayera, à 
partir de quelques notions premières consi- 
dérées comme intuitives, d’indiquer les 
résultats les plus élémentaires. 

E. U . 

fa 

1. Calcul booléen 
Les ensembles 

Leibniz, philosophe et mathématicien 
(1646-1 7 16), recherche un système qui lui 
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permette de formaliser le langage et la 
pensée. Pour lui, un langage formalisé doit 
être une pure combinaison de signes, dont 
seul importe l’enchaînement, de sorte 
qu’une machine serait capable de fournir 
tous les théorèmes et que toutes les contro- 
verses se résoudraient par un simple calcul. 

Leibniz, n’arrivant pas à exploiter tou- 
tes ses idées, dont certaines auraient pu le 
conduire à de meilleures conclusions, 
échoue dans sa tentative. Après lui, pen- 
dant tout le XVIII e siècle et au début du XIX e , 
d’autres auteurs ébauchent des tentatives 
semblables sans arriver à avancer plus que 
Leibniz. À cette époque, leurs travaux, de 
même que ceux de Leibniz, ne sont pas 
connus et n’ont qu’un très faible retentis- 
sement ; chacun ignore les travaux de ses 
prédécesseurs. 

C’est dans les mêmes conditions que le 
mathématicien anglais George Boole 
(1815-1864) va travailler. Boole peut être 
considéré comme le véritable créateur de 
la logique contemporaine. Son ambition 
est de formaliser la logique en s’inspirant 
des méthodes de l’analyse et de l’algèbre : 
« Que l’on donne des formes existantes de 
l’analyse une interprétation quantitative 
n’est que le résultat des circonstances dans 
lesquelles elles furent établies et ne doit pas 
être érigé en condition universelle de 
l’analyse. C’est sur le fondement de ce 
principe général que je me propose d’éta- 
blir le calcul logique et que je lui réclame 
une place parmi les formes reconnues de 
V •amhp'i mathématique, s&îïà egard au fait 
qu’en son objet comme en ses instruments 
il doive actuellement demeurer en dehors 
d’elle » (Thr Muthematical Analysis oj 
Logic, 1847). 

Ce sont les travaux de Boole qui ont 
donné naissance à ce qu’on appelle 
aujourd’hui l’algèbre de Boole (ou calcul 


booléen), en donnant un point de départ au 
calcul des propositions et à l’algèbre des 
ensembles. 

Notion d'ensemble 

Trois mots ou symboles seront constam- 
ment utilisés dans ce qui suit : « ensemble », 
« élément », « E » (qui se lit « est élément 
de » ou « appartient à »). Il est impossible 
de définir ces mots. En effet on pourrait 
dire : « Un ensemble est une collection 
d’objets », ou encore comme Cantor (dans 
Gesammelte Abhanlungen) : « Par ensem- 
ble, on entend un groupement en un tout 
d’objets bien distincts de notre intuition ou 
de notre pensée. » Dans ce cas, on ne fait 
que déplacer le problème et il reste à définir 
les mots « collection », « groupement », 
« objets ». La situation est tout à fait com- 
parable à celle qu’on rencontre lorsqu’on 
veut reconstruire la géométrie ; il n’est 
pas possible de définir les mots « point », 
« droite », « plan ». Pour les objets cor- 
respondants, on indique leurs propriétés 
et les règles d’utilisation : ce sont les axio- 
mes. 

Un ensemble est constitué d’éléments. 
Une image intuitive d’un ensemble est 
donnée par une collection d’objets, un 
groupement d’objets. Un élément d’un 
ensemble peut être soit un animal, soit un 
objet, soit un être mathématique, soit 
lui-même un ensemble. 11 existe en mathé- 
matique de nombreux exemples d’ensem- 
bles d’ensembles. 

Dans la suite, on représentera les élé- 
ments et les ensembles par des lettres de 
l’alphabet. Souvent les éléments sont dési- 
gnés par des lettres minuscules et les 
ensembles par des lettres majuscules. Rien 
n’oblige à respecter cette convention et 
cela devient impossible dans le cas des 
ensembles d’ensembles. 
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Pour exprimer que a est élément de 
l’ensemble E, que a appartient à l’ensem- 
ble E, on écrit : 

a EE. 

Pour exprimer que a n’est pas élément 
de l’ensemble E, que a n’appartient pas à 
l’ensemble E, on écrit : 

a£ E 

L’expression a £ E est la négation de 
l’expression a E E. Par suite, en vertu du 
principe du tiers exclu en logique et des 
relations qui existent entre une proposition 
et sa négation, il est possible de dire que, 
pour a donné et E donné, seule l’une de ces 
deux expressions est vraie et alors sa 
négation est fausse. 

Il faut ajouter à cela quelques règles 
propres à la théorie des ensembles : 

Règle 1. Un ensemble est parfaitement 
défini par la connaissance des éléments qui 
le constituent, ou encore : Deux ensembles 
sont égaux si, et seulement si, ils sont 
constitués par les mêmes éléments. 

Pour se donner un ensemble il suffit 
donc de se donner la liste de ses éléments. 
Exemples : l’ensemble constitué par les 
lettres a, e, i, o, u ; on le note habituelle- 
ment : { a, e, /, o, il }. L’ensemble constitué 
par les nombres 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 
10, 11, 12 sera noté de la même manière : 
[0, 1,2, 3, 4, 5, 6, 7,8.9, 10, 11, 12}. 

Mais il y a une deuxième manière de 
préciser un ensemble, en les construisant à 
partir d’ensembles déjà connus. Ainsi, si E 
désigne l’ensemble des êtres humains de 
nationalité française et si on considère 
l’expression « x est inscrit sur les listes 
électorales », cette expression est vraie 
pour certains Français, fausse pour 
d’autres. Elle va permettre de distinguer, 
dans l’ensemble des Français, ceux pour 
lesquels cette expression est vraie, et de 


définir ainsi un nouvel ensemble. Cet 
ensemble sera noté : 

{ x E E ; x est inscrit sur les listes 
électorales }. 

De même, dans l’ensemble A des lettres 
de l’alphabet français, on peut considérer 
celles pour qui l’expression : « Q est une 
voyelle » est vraie. On définit un ensemble 
noté : 

{OEA; Q estunevoyellel. 

On aurait aussi un autre ensemble : 

{ □ 6 A ; □ n’est pas une voyelle }. 

De même : 

{ x E E ; x n’est pas inscrit 

sur les listes électorales }. 

Admettre qu’on peut ainsi définir des 
ensembles revient à admettre le principe 
(ou règle) suivant : 

Règle 2. Quand on a un ensemble A et 
une propriété P, on peut définir un ensem- 
ble B dont les éléments sont les éléments 
de A ayant la propriété P. Si on note P(.v) 
l’expression « x a la propriété P », l’ensem- 
ble B peut s’écrire : 

{ A 1 G A ; P(*)}, 

ou, en vertu de l’égalité des deux ensem- 
bles, définie par la règle 1 et qui se traduit 
par le signe « = » : 

B = Ix 6 A; P(*)h 

Cette règle impose une définition. En 
effet l’ensemble B, défini ci-dessus, est tel 
que tous ses éléments sont des éléments de 
l’ensemble A. On dit que B est un sous- 
ensemble de A, une partie de A, ou encore 
que B est inclus dans A ou contenu dans A. 
On traduit cela par le symbole : « C » ; ainsi 
« B est un sous-ensemble de A » s’écrira : 

B C A. 
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Une conséquence de la règle 2 est qu’à 
partir d’un ensemble A quelconque on peut 
définir un ensemble particulier, qu’on 
appellera Y ensemble vide , de la manière sui- 
vante : Il suffit de considérer parmi les élé- 
ments de A ceux pour lesquels la propriété 
« être différent d’eux-mêmes » est vraie : 

[X G A; X ^ X }. 

On obtient ainsi un ensemble qui n’a 
aucun élément, appelé l’ensemble vide et 
noté : « 0 ». 

Paradoxe de Russell 

En 1905, Bertrand Russell montre que la 
notion d’« ensemble des ensembles qui ne 
sont pas éléments d’eux-mêmes » est 
contradictoire. La mise en évidence de ce 
résultat peut se faire de la manière sui- 
vante : à première vue les ensembles 
peuvent se partager en deux classes, la 
classe de ceux qui sont éléments d’eux- 
memes, classe de ceux pour lesquels 
l’expression X G X est vraie ; la classe de 
ceux qui ne sont pas éléments d’eux- 
mêmes, ceux pour lesquels l’expression 
X G X est fausse ou X G X est vraie. 
Désignons par A l’ensemble de tous les 
ensembles qui ne sont pas éléments d’eux- 
mêmes. Laquelle des deux expressions 
A G A ou A G A est-elle vraie ? 

Supposons que A G A soit vraie. Mais 
alors A ne peut pas être un élément de A, 
puisque par définition les éléments A sont 
des ensembles qui ne sont pas éléments 
d’eux-mêmes. L’expression A G A doit 
être vraie aussi. 

Supposons que A G A soit vraie. Mais 
alors, d’après la définition de A qui est 
constitué par les ensembles qui ne sont pas 
éléments d’eux-mêmes, on doit avoir 
A G A vraie. Dans un cas comme dans 
l’autre, on aboutit à une contradiction. Il 
sera donc interdit de parler de « l’ensemble 


des ensembles qui ne sont pas élé- 
ments d’eux-mêmes », et, pour les mêmes 
raisons, de l’ensemble de tous les ensem- 
bles. 

Ce paradoxe est à rapprocher du para- 
doxe célèbre du Menteur, où le problème 
est de savoir si l’homme qui dit : « Je 
mens » dit ou non la vérité en prononçant 
ces paroles. 

Représentation graphique 
Il est souvent commode de représenter un 
élément par un point du plan, et un 
ensemble par l’intérieur d’une courbe fer- 
mée. Ainsi la figure 1 représente un 
ensemble A, a n’est pas élément de A, b et 
C sont éléments de A. 

Les sous-ensembles sont alors repré- 
sentés comme des portions de rensem- 
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ble. Ainsi B est une partie ou SOUS- 
ensemble de A. Ce sont les diagrammes de 
Venn. 

Lewis Carroll propose une présentation 
analogue, mais l’ensemble A est représenté 
par un rectangle, un sous-ensemble B étant 
obtenu par partage du rectangle en deux 
par un segment de droite. Cette présenta- 
tion a l’avantage de conserver une symétrie 
entre le sous-ensemble B et le SOUS- 
ensemble complémentaire B constitué par 
les éléments de A qui ne sont pas dans B 

(fig. i). 

De toute manière, ces représentations 
ne sont que des images, et il y a au moins 
autant de différence entre ces images et les 
êtres mathématiques qu’elles représentent 
qu’entre un schéma et l’objet représenté 
par ce schéma vu qu’entre l’écriture d’un 
mot en français et la signification de ce 
mot. Mais de même que les schémas 
permettent de se représenter les objets et 
servent à penser et à raisonner, de même 
les figures proposées ci-dessus peuvent 
apporter une aide importante aux raison- 
nements. 

Ensemble des parties d’un ensemble 

Un ensemble A est partie ou sous-ensemble 
de E si tous les éléments de A sont des 
éléments de E. 

Pour un ensemble E ayant trois élé- 
ments désignés par «, b, c\ il est facile 
d’énumérer toutes ses parties. Il y a 
d’abord E lui-même, qui répond à la 
condition ci-dessus : E C E. Ensuite 
les parties ayant deux éléments, ce sont : 

{ a, b } , { a, c } , { b, c } . Ensuite les 
parties ayant un élément : { a }, { b }, 

{ c }. Enfin la partie vide : 0. Il est facile 
de voir que l’ensemble vide est une partie 
de E soit en remarquant qu’il vérifie la 
définition ci-dessus, soit en remarquant 


qu’il peut être défini de la manière sui- 
vante : 

0 = { * e E, X &E} 

L’ensemble des parties de E sera donc 
un ensemble de 8 éléments : 

| {a, b, c}, [a, b }, {a, c}, {b, c}, [a], { b }, {c}, 0 J . 

Pour un ensemble quelconque E, on 
peut être amené à considérer des parties de 
E et l’ensemble des parties de E. Nous 
admettrons l’existence de ce nouvel ensem- 
ble, dont la définition pourrait être : 
L’ensemble des parties d’un ensemble E 
est un ensemble dont les éléments sont les 
sous-ensembles ou parties de E. Cet ensem- 
ble est noté : ( S (E). Ainsi : 

X C E « X G s (E) . 

Pour l’ensemble {a, b, c }, on aura : 

‘S ({ a, b, c }) = -[ [a, b, c}, {a, b }, 

{ a, c }, { b, c }, { a }, { b }, { c }, 0 }. 

De même : 

îT ({ a, b }) = { { a, b }, { a }, { b }, 0 } ; 

‘J (1 a })= { { a 1,0}. 

Si l’ensemble E a un élément, îï' (E) a 
deux éléments ; si E a deux éléments, ff (E) 
en a quatre ; si E a trois éléments, Y‘ (E) en 
a huit ; on peut généraliser et voir que si 
l’ensemble E a n éléments, l’ensemble 
ïf (E) en a 2". Cette règle peut apparaître 
à l’aide d’un arbre de choix tel que celui qui 
est représenté sur la figure 2 dans le cas 
d’un ensemble à trois éléments : a, b, C. 

On voit ici que, chaque fois qu’on 
ajoute un élément, il y aura dédoublement, 
donc multiplication par 2 du nombre 
d’éléments. On démontre alors le résultat 
par récurrence. 

On peut aussi organiser l’ensemble des 
parties d’un ensemble sur un schéma en 
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reliant deux parties par une flèche 
lorsqu’on passe de l’une à l’autre par 
adjonction d’un élément à la première 
(fig. 3). Ainsi, si l’ensemble a un seul élé- 


sous-ensemble d’une autre s’il existe un 
chemin dans le sens des flèches allant de la 
première à la deuxième (cf. ensembles 
ORDONNÉS) 



ment a, il a deux parties : 0 et { a } . Pour 
E = ( a, b }, on trouve quatre parties : 0, 
(a), {/?},{ a, b } ; remarquons qu’on 
passe des deux premières aux deux derniè- 
res par adjonction A i n mIUHxc'V?* h Pour 
E = {a, b, c }, on aurait un schéma obtenu 
par dédoublement du précédent. 

On pourrait continuer ainsi pour des 
ensembles à 4, 5, 6, éléments. On a ici 
un schéma de l’organisation par la relation 
« est sous-ensemble de » de l’ensemble des 
parties d’un ensemble, une partie étant 


Algèbre des ensembles 
Pour ce qui suit, il est commode de suppo- 
ser donné un ensemble E et de ne considé- 
rer que des sous-ensembles de E, donc des 
éléments uc ;i Oïl appeiie quelquefois 
référentiel cet ensemble fixe auquel on se 
réfère. Cela permet de définir des opéra- 
tions dans ST (E) : intersection, union, etc. 

Intersection de deux ensembles 

Si A et B sont deux ensembles, il peut être 
commode dans certains cas de considérer 
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l’ensemble des éléments communs. Ainsi, 
dans l’ensemble des Français, si A désigne 
l’ensemble des Français inscrits sur les 
listes électorales en 1970 et si B désigne 
l’ensemble des Français habitant la ville de 
Paris pendant l’année 1970, il peut être 
intéressant, dans certains cas, de pouvoir 
considérer l’ensemble des Français inscrits 
sur les listes électorales et habitant la ville 
de Paris en 1970. Un tel ensemble, cons- 
titué par les éléments communs à l’ensem- 
ble A et à l’ensemble B, sera appelé 
l’intersection de A et de B. On le note 
A H B, ce qui se lit « intersection de A et 
de B ». 

Ainsi, si, dans l’ensemble des mots 
français, A désigne l’ensemble des mots 
dont la première lettre est un « a », B 
désigne l’ensemble des mots dont la der- 
nière lettre est un « p », A fl B désigne 
alors l’ensemble des mots dont la première 
lettre est un « a » et la dernière est un « p ». 

On peut donner une définition formelle 
de l’intersection : 

AHB = { x E E ; * E A et x E B ) . 

L’intersection de A et de B est l’ensem- 
ble des éléments de E qui sont éléments 
de A et éléments de B (fig. 4). Dans 
cette définition, un mot est important, c’est 
le mot « et ». La définition est fondée sur 
la conjonction de deux propriétés : l’appar- 
tenance à A, l’appartenance à B. Toutes les 
propriétés de l’intersection sont des tra- 
ductions, en langage des ensembles, des 
propriétés du mot « et » dans le langage 
courant et en logique des propositions. 

Voici un autre exemple d’intersection : 

A = { 1, 2, 3, 6, 9, 18 }, 

B = { 1, 3, 5, 9, 15,451, 

AHB = [1,3,9 1, 

où A est l’ensemble des diviseurs de 18, B 
est l’ensemble des diviseurs de 45, et A RB 


fig- 4 
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Intersection de deux ensembles 


est l’ensemble des diviseurs communs à 18 
et à 45. 

Dans le cas où l’intersection de A et de 
B est l’ensemble vide, on dit que A et B 
sont disjoints. 

Parmi les propriétés de l’intersection, 
on peut signaler : 

(a) A H B C A et A H B C B, 

i.e. l’intersection de A et de B est un 
sous-ensemble de A et un sous-ensemble de 
B ; c’est aussi un sous-ensemble de tout 
ensemble contenant A ou B comme SOUS- 
ensemble. 

(b) A n B = B n A, 

i.e . l’intersection de A et de B est égale à 
l’intersection de B et de A, ce qui tient au 
fait qu’il revient au même de dire que « x est 
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élément de A et élément de B » ou de dire 
que « x est élément de B et élément de A ». 

(c) (A n B) n c = An(Bnc), 

cela veut dire que l’intersection de A fl B 
avec C donne le même résultat que l’inter- 
section de A avec B Pi C. L’ordre dans 
lequel on effectue l’opération intersection 
n’a pas d’influence sur le résultat, ce qui 
permet de supprimer les parenthèses dans 
l’écriture : 

(A n B) n c = ao (B n c) = a n b n c. 

Cette propriété est à rapprocher de 
celle du mot « et » dans le langage cou- 
rant ; en effet, il revient au même de dire : 
« est élément de A et de B, et est aussi 
élément de C » que de dire « est élément 
de A et est élément de B et de C ». 

(d) A Pi A = A, 

i.e. l’intersection de A avec A est A 
lui-même. 

(e) A H 0 = 0, 

i.e. l’intersection de A avec l’ensemble vide 
est l’ensemble vide. 

(f) Afl B = A«ACB, 

i.e. l’intersection de A et B est égale à A si, et 
seulement si, A est un sous-ensemble de B. 

(g) (D C A et D C B) D C A Cl B, 

Le. tout sous-ensemble commun à A et B 
est un sous-ensemble de leur intersection et 
réciproquement. 


appartement, on peut avoir à considérer 
l’ensemble des Français qui ont une 
voiture ou un appartement. Ce nouvel 
ensemble sera appelé la réunion de A et 
de B. 

La réunion de deux ensembles A et B 
est un ensemble constitué par les éléments 
qui appartiennent à A ou à B. On note 
« A U B » ce nouvel ensemble. « A U B » 
se lit « union de A et de B », ou encore « A 
union B » (fig. 5). 

I fig. 5 I 
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Réunion de deux ensemble+ 


Réunion de deux sous-ensembles 

Si A et B sont deux ensembles, il peut 
être intéressant, dans certains cas, de 
« réunir » leurs éléments en un ensemble 
global. Ainsi, si A désigne l’ensemble des 
Français possédant une voiture et B 
l’ensemble des Français possédant un 


La définition formelle peut s’écrire : 

AUB = (tGE;x€Aou xCB}. 

Dans cette définition, le mot « ou » joue 
un rôle très important et toutes les pro- 
priétés de la réunion sont des traductions, 
en langage des ensembles, des propriétés 
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du mot « ou » au sens non disjonctif dans 
le langage courant et en logique des 
propositions. 

Voici un exemple de réunion : 

A = {b, la, n,c }, 

B = { b, l, e, u }, 

A U B = { b, l, a, e, n, c, u } . 

Parmi les propriétés de la réunion, il 
faut signaler : 

(a) A C A U B et BCAUB, 

Le. A et B sont des sous-ensembles de la 
réunion A U B. 

(b') A U B = B U A, 

i. e . la réunion de A et de B est égale 
à la réunion de B et de A, car il revient 
au même de dire que « x est élément de A 
ou de B » et de dire que « x est élément de B 
ou de A ». 

(c ) (A U B) U C = A U (B U C), 

i.e. la réunion de A U B avec C donne le 
même résultat que la réunion de A avec 
BUC. L’ordre dans lequel on effectue les 
réunions n’a pas d’influence sur le résul- 
tat ; on peut donc supprimer les parenthè- 
ses dans l’écriture : 

(AUB)UC= A U (B U C) = AUBUC. 



Au(BnC) 


On pourrait rapprocher cette propriété 
de celle du mot « ou » dans le langage 
courant. 

(cT) A u A = A , 

i.e. la réunion de A avec A est A. 

(e') A U 0 = A, 

le, la réunion de A avec l’ensemble vide est 
A lui-même. 

(f ') AUB — B <=> A C B, 

Le. la réunion de A et de B est égale à B si, et 
seulement si. A est un sous-ensemble de B. 

(g ) (A C D et B C D) <=> A U B C D, 

i.e. A et B sont sous-ensembles d’un 
ensemble D si, et seulement si, la réu- 
nion de A et de B est un sous-ensemble 
de D. 

Enfin deux propriétés de distributivité, 
faisant intervenir la réunion et l’intersec- 
tion sont à signaler (fig. 6) : 

A U (B 0 C) = (A U B) n (A U C), 

AO (B U C) = (AH B) U (A n C). 

Complémentaire 

Tous les ensembles considérés ici sont des 
parties d’un même ensemble E. On peut 
remarquer que chaque fois que l’on définit 

fig. 6 



/tn(fiuC) 
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une partie de E, on définit automatique- 
ment une autre partie de E, celle qui est 
constituée par les éléments de E qui ne sont 
pas dans la première. Ainsi, dans l’ensem- 
ble des Français, en définissant l’ensemble 
des Français inscrits sur les listes électo- 
rales, on définit en même temps l’ensemble 
des Français qui ne sont pas inscrits sur les 
listes électorales. 

On appelle complémentaire d’un ensem- 
ble A, sous-ensemble de E, l’ensemble 
constitué par les éléments de E qui ne sont 
pas dans A (fig. 7). On note « A » ou 
« CA » le complémentaire de A. On peu-i- 
écrire : 

A = [x GE ;x £ A }. 

Quand on parle de complémentaire, 
il est très important de bien préciser 
l’ensemble de référence E. Évidemment, le 
complémentaire de A est un SOUS- 
ensemble de E. Entre les parties d’un 
ensemble E, la complémentarité établit 
une correspondance un à un, une appli- 
cation bijective (cf. Propriétés des appli- 
cations in chap. 2) de l’ensemble iF (E) 
dans lui-même. 

Le complémentaire étant défini à partir 
de la négation, négation de la proposition 
« appartient à A », ses propriétés sont la 


traduction, en langage des ensembles, de 
celles de la négation. 

(a") A = A, 

i.e. le complémentaire du complémentaire 
de A est A lui-même. 

(b") 0 — E et E — 0, 

i.e. le complémentaire de l’ensemble vide 
est l’ensemble E, et le complémentaire de 
l’ensemble E est l’ensemble vide. 

(c") AfïÂ = 0 et A U Â = E, 

i.e. l’intersection de A et de son complé- 
mentaire est vide, et la réunion de A et de 
son complémentaire est l’ensemble E. Cela 
constitue une propriété caractéristique du 
complémentaire et aurait pu être pris 
comme définition. 

(d") ACB^BCÂ. 

i,C, A est un SC , -ensemble de B si, et 
seulement si, le complémentaire de B est un 
sous-ensemble du complémentaire de A. 
Les lois de De Morgan : 

(é’) AnB-ÂuB, AuB=ÂOB, 

expriment (fig. 8 et 9) que le complémen- 
taire de l’intersection de deux ensembles 
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fig. 8 





A 0 B 
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B B 


Complémentaire d’une intersection A f)B - A y fi 



ÂnB 




B B 

Complémentaire d’une réunion A U B = A fl B 


fig. 9 



est égal à la réunion des complémentaires 
de ces deux ensembles, et le complémen- 
taire de la réunion de deux ensembles est 
égal à l’intersection des complémentaires 
de ces deux ensembles. 

Autres opérations 

On peut définir d’autres opérations entre 
les parties d’un ensemble. Ainsi la 
différence A - B de deux ensembles A et B 
est l’ensemble constitué par les éléments de 
A qui ne sont pas éléments de B (fig. 10). 

On remarque facilement que : 

A — B = A O B, 

A- (A — B) = Afl B, 

A — B = 0 <=> ACB, 

A - A = @ . 


fig. K 



^Différence A - B | 

La différence symétrique de deux 
ensembles A et B est un ensemble constitué 
par les éléments de A qui ne sont pas dans 
B et les éléments de B qui ne sont pas dans 
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A (fig. 11). On le notera A A B, dans ce 
qui suit. 

î fig- il 



Différence symétrique An B 


On peut vérifier les égalités : 

AAB = (A— B ) U ( B— A) , 

aab = (A n B) u (B n a), 

A AB = B A A , 

(AAB) AC = AA (BAC), 

A A 0 = A, A A A = 0. 

Algèbre et onneou de Boole 

L’ensemble ST (E) des parties d’un ensem- 
ble muni des opérations d’union et d’inter- 
section et de la complémentarité constitue 
ce qu’on appelle une algèbre de Boole. En 
effet, les propriétés suivantes sont vérifiées : 

a) Les opérations d’union et d’inter- 
section sont associatives : 

(AUB)UC = AU(BUC), 

(ao b) ne = An(Bnc), 

et commutatives : 

AUB = BUA, 

ah b = b n a. 

b) Il y a un élément neutre pour 
chacune des deux opérations : pour 
l’union, 0 est élément neutre, car quel que 
soit l’ensemble A on a : A U 0 = A ; et, 
pour l’intersection, E est élément neutre, 


car quel que soit A dans J' (E), on a : 

A fl E = A. 

c) Chacune des deux opérations est 
distributive par rapport à l’autre : 

a n (B u c) = (a n b) u (a n c), 

AU(BnC) = (AUB)n(AUC). 

d) Le complémentaire A de A vérifie 
les deux propriétés : A U A = E (élément 
neutre de l’intersection), et A Pi A = 0 
(élément neutre de la réunion). 

Si maintenant on considère l’ensemble 
T(E) muni des opérations de différence 
symétrique et d’intersection, il a une struc- 
ture d' anneau de Boole. En effet, la diffé- 
rence symétrique donne une structure de 
groupe commutatif à T(E) ; l’opération 
intersection donne alors à S(E) une struc- 
ture d’anneau booléen (cf. anneaux et 
ALGÈBRES) . 

Fonctions coroctéristiques 

Il est commode de présenter les opérations 
entre parties d’un ensemble en utilisant les 
fonctions caractéristiques. Si A est une 
partie de E, la fonction caractéristique de 
l’ensemble A est une fonction qui à chaque 
élément de E associe 1 si cet élément 
est dans A et 0 si cet élément n’est pas 
dans A. 

Lorsqu’on a la fonction caractéristique 
d’une partie A de E, il est facile de 
déterminer celle du complémentaire A de 
A. Il suffit de changer les 0 en 1 et les 1 en 
0. Il est aussi facile de voir si un ensemble 
est inclus dans un autre : on voit que B est 
inclus dans A si, chaque fois que la 
fonction caractéristique de B a la valeur 1, 
celle de A l’a aussi. Les éléments de 
l’intersection de A et de B sont ceux pour 
lesquels les fonctions caractéristiques de A 
et de B prennent ensemble la valeur 1. La 
fonction caractéristique de A fl B est donc 
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facile à construire. Il en est de même pour 
celle de A U B. 

Tout cela peut s’interpréter autrement. 
En effet, considérons l’ensemble X ayant 
deux éléments { 0, 1 } et définissons sur cet 
ensemble deux opérations. 

La première opération sera notée + et 
sera définie par : 

0 + 0 = 0 
0+1 = 1 
1 + 0=1 

1 + 1 = 1 . 

La deuxième opération sera notée et 
sera définie par : 

0,0 = 0 
0.1 =o 
1,0 = 0 
1.1=1. 

Cet ensemble X muni des deux opé- 
rations -+ et . définies ci-dessus constitue 
ce qu’on appelle une algèbre de Boole, 
c’est l’anneau Z/( 2) des entiers relatifs 
modulo 2. Il joue un rôle fondamental en 
logique des propositions. En effet, si on 
interprète 1 comme le « vrai » et 0 comme 
le « faux », valeur qu’on peut attribuer aux 
propositions, les opérations -)- et . sont 
alors la disjonction (ou) la conjonction (et) 
des propositions. Enfin la complémenta- 
rité qui est ici l’échange de 0 en 1 et de 1 
en 0 s’interprète comme une négation. 

Les fonctions caractéristiques sont alors 
des fonctions qui prennent leur valeur dans 
l’ensemble X, et si on désigne par / A la 
fonction caractéristique de A on a : 

/ahb = /a ./b, 

/aub = A +/b> 

A + A = h = b 
A. /À =/o = 0- 

Remarquons que la formule : 

Aub = A + A* 


ne serait pas vraie si on définissait l’addi- 
tion des nombres au sens usuel ; on aurait 
alors / AUB =/ A + J b — /a/b- 

Partition d’un ensemble 

Lorsqu’on a un ensemble d’objets ayant 
chacun une couleur bien déterminée, on 
peut être amené à les classer suivant leur 
couleur. On effectue ainsi une classifica- 
tion des objets, chaque objet étant dans 
une classe et une seule. On a de la sorte une 
image de ce que le mathématicien appelle 
une partition. 

Une partition d’un ensemble est un 
ensemble de parties non vides de cet 
ensemble tel que deux parties distinctes 
n’aient pas d’élément commun et que 
chaque élément de l’ensemble soit dans 
une de ces parties. C’est en quelque sorte 
l’ensemble des classes d’une classification. 

Ainsi, dans l’ensemble des entiers natu- 
rels N = { 1. 2, 3, 4, }, on peut 
constituer une partition en trois classes en 
plaçant dans la première classe les nom- 
bres divisibles par 3, dans la deuxième ceux 
dont le reste de la division par 3 est 1, dans 
la troisième ceux dont le reste est 2. Ainsi 
chaque nombre est rangé dans une classe 
et aucun ne se trouve dans deux classes en 
même temps. Les classes sont alors : { 0, 
3 , 6 , 9 , 12, 15, }, { 1 , 4 , 7 , 10, ... } et (2, 

5 , 8 . 11 , }. 

On trouve de nombreux exemples de 
partitions dans les problèmes de range- 
ment, les dépouillements de questionnai- 
res, les classifications, etc. 

Quelques applications 

Circuits électriques 

L’algèbre de Boole étudiée ci-dessus, ou 
algèbre des parties d’un ensemble, peut 
être appliquée à l’étude des circuits élec- 
triques. Ainsi, dans un circuit relié &UX 
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deux pôles d’une pile par exemple, si on 
place un interrupteur à deux positions, 
deux cas peuvent se présenter : ou bien 
l’interrupteur est fermé et le courant passe, 
on peut noter cela par 1 ; ou bien 
l’interrupteur est ouvert et le courant ne 
passe pas, on peut noter ceci par 0. On 
peut alors définir des opérations sur les 
interrupteurs analogues à celle que nous 
avions dans l’ensemble X = (0.1 } 
ci-dessus. 

Deux interrupteurs I et J disposés en 
série ne laissent passer le courant que s’ils 
sont fermés tous les deux. Notons I . J 
cette combinaison en série des deux inter- 
rupteurs 1 et J ; l’état de I J est alors défini 
par la table : 


1 

J 

I'J 

1 

1 

1 

1 

0 

0 

0 

1 

0 

0 

0 

0 


De même, si deux interrupteurs sont 
placés en parallèle, le courant passe dès 
que l’un ou l’autre des interrupteurs est 
fermé. Si on note I + J l’état du circuit, 

I + J est défini à partir de 1 et de J comme 
l’indique le tableau suivant : 

I | J | I + J 


1 

1 

1 

0 

0 

1 

0 

0 


Enfin on peut retrouver la négation par 
un circuit complémentaire I, le tableau 
donnant l’état de chacun des circuits I 
et I : 

1 1 

1 I 0 

0 I 1 

Cela peut permettre d’étudier les cir- 
cuits électriques, mais, réciproquement, 
c’est ce qui a permis l’utilisation des 


circuits électriques dans les machines à 
calculer électroniques. 

Informotion analogique 

L’information analogique décrite mathé- 
matiquement par des fonctions continues 
(signal électrique issu d’un microphone) 
doit être quantifiée et codée pour être 
traitée par les procédés de l’électronique 
moderne utilisant largement les micropro- 
cesseurs et le traitement numérique de 
l’information. 

Le principe de la quantification est le 
suivant. Au signal analogique est associé 
un nombre d’états possibles selon le gra- 
phe de la figure 12 



Le nombre d’états possibles de quanti- 
fication est en général élevé, 2 12 par 
exemple. Le traitement numérique impose 
d’associer à chaque état de quantification 
une suite de valeurs booléennes (12 varia- 
bles booléennes peuvent être utilisées) ; 

alors, représentée par une 
suite d’états 0 ou 1. 

Une application connue de tous est le 
disque compact ; celui-ci permet de stocker 
les suites binaires sous forme de « trous » 
situés sur le sillon du disque. Le nombre de 
0 et de 1 stockés sur le disque compact est 
très élevé : 3 000 mégaéléments binaires ! 
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L’évolution est loin d’être terminée : les 
images sont stockables en utilisant le même 
procédé, et l’on attend beaucoup de la 
logique floue (fondements mathématiques 
dérivés de l’algèbre de Boole, mais diffé- 
rents) et des réseaux de neurones. 

ANDRÉ ROUMANET 


2. Relations 

Produit cartésien 
te couple 

Soit E et F deux ensembles, Pour x G E et 
y G F, on introduit un nouvel objet 
mathématique, le couple de premier terme 
x et de second terme y, défini par le 
symbole : 

ix,y), 

avec la convention que : 

(x, y) = (x’, y’) ^ x = x’ et y = y’. 

On appelle produit cartésien de deux 
ensembles E et F, noté E X F, l’ensemble 
des couples ayant pour premier terme un 
élément de E et pour second terme un 
élément de F. Par exemple, si E = {a, b, 
c] et F = {A, B} sont des ensembles à 
trois et deux éléments respectivement, 
l’ensemble E X F a six éléments qui sont : 

(a. A), {a, B), (b, A), (b, B), (c, A), (c, B), 

et l’ensemble E X E a neuf éléments qui 
sont : 

{a, a), (a, b), ( a,c ), (b, a), (b, b), 

( b , c), (c, a), (c, b ), (c, c ) ; 

plus généralement, si E et F sont des 
ensembles finis contenant m et n éléments, 
le produit cartésien E X F est fini et 
contient mn éléments. 


Justifions la terminologie de cartésien. 
Le choix de deux axes de coordonnées 
dans le plan de la géométrie élémentaire 

permet d’identifier l’ensemble des points 
du plan à l’ensemble R X R = R 2 des 
couples de nombres réels, au point M 
correspondant le couple ayant pour pre- 

mier terme l’abscisse de M et pour second 
terme son ordonnée ; c’est le principe de la 
géométrie analytique de Descartes, chez 

qui apparaît pour la première fois la notion 
mathématique de couple. 

De nos jours, on définit souvent ainsi le 
plan de la géométrie élémentaire ; dans ce 
qui suit, cette identification sera toujours 
faite. 

Représentations graphiques 
On représente souvent (représentation dite 
cartésienne) un ensemble produit E X F 
par l’ensemble des points d’un rectangle 
(surtout ne pas confondre avec les dia- 
grammes de Carroll !), les ensembles E et 
F étant représentés par deux côtés perpen- 
diculaires de ce rectangle (fig. 13) ; un 

1 fig. 13 I 



sous-ensemble A de E X F est alors repré- 
senté par un sous-ensemble de ce rectan- 
gle. 

Dans le cas d’ensembles finis, on peut 
faire le tableau donnant les éléments de 
l’ensemble produit ou utiliser une repré- 
sentation par des points du plan (cf. fig. 14 
pour l’exemple ci-dessus). Pour représen- 
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fig. 1 4 
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E X F pour E = j a, b, c } et F = JA. Q\ 


ter les sous-ensembles, on peut indiquer 
leurs éléments sur la représentation, mais 
on peut aussi utiliser la représentation 
sagittale, dont voici le principe : on repré- 
sente le couple („v, y) par deux points 
(appelés x et y) réunis par une flèche allant 
de .Y vers y ; dans le cas particulier d’un 
couple (x, x), on dessine une boucle fermée 
allant de .Y à x. Sur la figure 15, on donne 
les représentations cartésienne et sagittale 
du sous-ensemble : 

X = {(a, B), (b, A), (c. A), (c, B)} 
de l’ensemble E X F vu ci-dessus. 


l’ensemble produit E X F, c’est-à-dire une 
propriété des couples (.Y, J/),X E F et y 6 F. 
Ainsi une relation définit un sous-ensemble 
de E X F, appelé son graphe , formé des 
couples pour lesquels la relation est vraie 
(cf. chap. 1). Réciproquement, tout SOUS- 
ensemble A C E X F définit une relation 
de source E et de but F, à savoir la propriété : 

{x,y) G A 

du couple (.Y, y). Forsque F = E, on dit 
qu’on a une relation sur E. Si une relation 
fil est vraie pour le couple (x, v), on écrira 
souvent x R V- 


Relations binaires 

Soit E et F des ensembles. Une relation de 
source E et but F est une propriété sur 


Exemples 

(1) Sur un ensemble E, la relation d’égalité 
« x = V » a pour graphe l’ensemble des 
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fig. 16 



couples (a, x), X E E ; cet ensemble est 
appelé la diagonale de l’ensemble EXE. 

(2) Prenons pour E l’ensemble des quatre 
voyelles { a , e, i, o] et pour F l’ensemble des 
quatre premiers chiffres { 1, 2, 3, 4) ; la 
figure 16 indique les représentations car- 
tésienne et sagittale de la relation « la 
voyelle x figure dans l’écriture en langue 
française du chiffre y ». Par exemple (a, 4) 
appartient au graphe (car a est dans 
quatre), mais (a, 3) ne lui appartient pas. 

(3) Prenons E = F = {1, 2, 3, 4, } et la 
relation sur E « x + y est divisible par 3 ». 
Le graphe contient cinq éléments, qui sont : 

(1, 2), (2, 1), (2, 4), (4| 2), (3, 3); 

la figure 17 donne la représentation sagit- 
tale de ce graphe : remarquer la boucle 
pour représenter (3. 3). 

(4) Sur l’ensemble R des nombres réels, 
soit la relation « x y ». Si on identifie, 
comme indiqué ci-dessus, l’ensemble des 
couples de nombres réels aux points du 
plan, le graphe est constitué des points 
de la première bissectrice y — x et des 
points situés au-dessus de cette droite 
(fig. 18). 

(5) Toujours sur R, considérons mainte- 
nant la relation « X~y < 1 ». Son 
graphe est ici la bande du plan comprise 


r 


fig i 7 



Graphe de la relation if x + y est divisible par 3 y 
sur E | l 2, 3, 4 | 


entre les deux droites x — y = 1 et 
x-y = - 1 (fig. 18). 

(6) Encore sur R, soit la relation « x — } 
est un entier relatif » ; le graphe de cette 
relation est le sous-ensemble du plan 
formé des droites y — x + n, lorsque n 
parcourt l’ensemble des entiers relatifs 
(fig. 18). 

Propriétés des relations 

On se limite maintenant à des relations sur 
un ensemble E et on se propose de dégager 
un certain nombre de propriétés de ces 
relations. 
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Une relation sur E est dite réflexive si, 
pour tout élément X G E, la relation est 
vraie pour le couple (x, x) ; cela revient 
donc à dire que tous les couples (x, x) 
appartiennent au graphe de la relation, ou 
encore que ce graphe contient la diagonale 
de l’ensemble EXE. Les relations don- 
nées ci-dessus sont réflexives dans les 
exemples ( 1 ), ( 4 ), ( 5 ), ( 6 ), non réflexives 
dans l’exemple (3). 

Une relation sur E est dite symétrique 
si, toutes les fois que la relation est vraie 
pour un couple (x, y), elle est aussi vraie 
pour le couple (y, x). Ainsi les relations des 
exemples (1), (3), (5), (6) sont symétriques, 
celle de l’exemple (4) ne l’est pas. A 
l’opposé, une relation est dite antisymétri- 
que si on a nécessairement x = y quand la 
relation est vraie à la fois pour le couple (x, 
y) et pour le couple (y, x) ; c’est le cas 
de (4). 

Une relation sur E est dite transitive si. 
toutes les fois que la relation est vraie pour 
des couples (x, y) et (y, z), elle est aussi 
vraie pour le couple (x, z). Ainsi, les 
relations des exemples (1), (4), (6) sont 
transitives, celles des exemples (3) et (5) ne 
le sont pas : ainsi, dans l’exemple (3), la 
relation est vraie pour les couples (1, 2) 


et (2, 4 ), mais ne l’est pas pour le couple 
( 1 , 4 ). 

Avec ces notions, on peut désor- 
mais distinguer différents types de rela- 
tions. Les relations d'ordre sont les rela- 
tions qui, comme dans l’exemple ( 4 ), 
sont réflexives, antisymétriques et tran- 
sitives ; ces relations sont très impor- 
tantes, mais nous ne les étudierons pas 
ici, et nous renvoyons à l’article ensem- 
bles ordonnés . Les relations d’équiva- 
lence sont celles qui, comme dans T exem- 
ple (6), sont réflexives, symétriques et 
transitives (cf. infra , Relutions d'équiva- 
lence). 

Applications d’un ensemble 
dans un autre 

Définitions 

On revient à la situation générale de deux 
ensembles E et F et d’une relation de 
source E et de but F. 

Nous dirons qu’une relation de 
source E et de but F est une application de 
E dans F si, pour tout élément x G E, il 
existe un unique élément y G F tel que la 
relation soit vraie pour (x, y). Ainsi à tout 
élément x G E correspond un unique élé- 
ment y G F appelé l'image de x par 
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l’application. Si l’application est désignée 
par/, on notera y = /(x) l’image de x ; on 
écrira : 

/ : E — F 

pour exprimer que / est une application de 
E dans F, et : 

x =f(x ) 

pour exprimer que y est l’image de x 
par / Si E et F sont des ensembles finis, 
la flèche de la représentation sagi- 
ttale représente le passage de x à son image 
/*)• 

La relation d’égalité sur un ensemble E 
donne un exemple trivial d’application ; 
l’image de tout élément x G E est cet 
élément x lui-même. On obtient ainsi ce 
qu’on appelle Y application identique de E 
dans lui-même, notée 1,. 

On introduit aussi souvent, non sans 
quelques confusions, la notion de relation 
fonctionnelle, ou de fonction. Une relation 
de source E et de but F est une fonction 
si, pour tout élément x G E, il existe au 
plus un élément y G F pour lequel la 
relation est vraie. On appelle alors ensem- 
ble de définition d’une telle fonction le 
sous-ensemble E’ de E formé des éléments 
A' G E pour lesquels il existe effectivement 
un tel y ; si on fait correspondre à tout 
élément x G E’ cet élément y G F, on 
définit une application de E’ dans F, mais 
il est fondamental, si E’ ^ E, de ne pas 
confondre la fonction initiale de l’appli- 
cation que nous venons de lui associer, car 
la première relation est de source E et la 
seconde de source E’. Par exemple, consi- 
dérons sur R la relation : 


c’est une fonction dont le domaine de 
définition est l’ensemble E’ des nombres 
réels différents de 1 et elle définit une 
application f : E’ — ► R telle que : 


Si / : E — ► F est une application de E 
dans F, on appelle graphe de / son graphe 
au sens général défini ci-dessus pour une 
relation. C’est le sous-ensemble de E X F 
formé des couples (x,//)), X G E ; ainsi, si 
G est ce graphe : 

(. j ) GG ^=/(4 

Dans le cas où E C R et F = R, le 
graphe est le sous-ensemble de R 2 formé 
des couples (x, y) tels que x G E et 
y — /(x) ; c’est le graphe, au sens usuel, 
de/. 

Composition des applications 

Soit f : E — ► F et g : F — * G deux 
applications ; remarquons ce qui est essen- 
tiel ici, que l’ensemble source de g est 
le même que l’ensemble but de / Consi- 
dérons la propriété suivante des couples 
(x, z) G E X G : il existe un élément 
y G F tel que y = /(x) et z =g(y) \ cette 
relation sur E X G est en fait une 
application de E dans G. En effet, pour x 
G E donné, l’élément y = f[x) est parfai- 
tement déterminé, et la relation exprime 
que z = gifix)). Ainsi, à tout x G E cette 
application, appelée application composée 
defet g et notée g o /(dans cet ordre) fait 
correspondre à x l’unique élément z image 
par g de l’élément y — /(x). Pratiquement, 
pour trouver l’image par go/ d’un 
élément x G E, on cherche donc d’abord 
l’image y de x par / puis l’image par g de 
cet élément y. 
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Soit par exemple les ensembles 
E = [a, b , c }, F = {a, (3, y, b] e t 
G = { 1, 2, 3} ; considérons /: E — * F et g : 
F — ¥ G telles que : 

m = p, m = a, /(c) = ô 

et 

g( a) = 1, g(P) = 3, g(7) = 2, g(ô) = 2 ; 

l’application g o f est telle que : 

g o f(a) = 3 , g of(b) = h g o /(c) = 2 

(la figure 19 représente les diagram- 
mes sagittaux des graphes de ces applica- 
tions) 

I fi 9- U I 




Composition des applications 


Avec E = F = G = R, voici un autre 
exemple. Soit f :R— ► R et g : R — ►R 
définies par f(x) = x 2 et g(x) = 2x + 1 ; 
ici on peut composerfet g, mais aussi g et 
f. Ces deux applications de R dans R sont 
définies par g 0 f{x) = 2x 2 -f- 1 et 
/ o g(x) = (2x + l) 2 ; il s’agit d’applica- 
tions distinctes. 


Propriétés des applications 

Une application /: E — ► F est dite surjective 
si, pour tout élément y E F, il existe au 
moins un élément x G E ayant pour image 
y, c’est-à-dire tel que y = /(x) ; on dit 
souvent quefest une application de E sur 
F, ou est une surjection. Ainsi, dans le 
premier exemple donné ci-dessus (cf. 
« Composition des applications »), l’appli- 
cation g est surjective ainsi que l’applica- 
tion go fl l’application /, au contraire, ne 
l’est pas, car il n’existe aucun élément de 
E ayant pour image y. 

Une application f : E — ► F est dite 
injective si, pour tout élément y E F, il existe 
au plus un élément x G E ayant pour image 
y; cela revient à dire que deux éléments 
distincts de E ont des images qui sont des 
éléments distincts de F. On dit souvent que 
f est une injection de E dans F. Ainsi, 
toujours en reprenant le premier exemple 
donné dans « Composition des applica- 
tions », les applications f et g o f sont 
injectives, tandis que g ne l’est pas (en effet, 
y et ô ont même image par l’application g). 

Attirons l’attention ici sur l’importance, 
pour définir une application, de préciser 
les ensembles source et but. Ainsi, dési- 
gnant par R+ l’ensemble des nombres 
réels positifs, considérons les trois appli- 
cations : 

f : R R, définie par f(x) = x 2 , 
g : R — 1 ► R+, définie par g(x) = x 2 , 
h : R+ — ► R, définie par h(x) = x 2 , 

ces trois applications sont distinctes et 
possèdent des propriétés différentes : f 
n’est ni injective ni surjective, g est sur- 
jective, mais n’est pas injective, et h est 
injective, mais n’est pas surjective. 

Bijections 

Une application f: E — ► F qui est à la fois 
injective et surjective est dite bijective ; on 
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dit aussi que f est une bijection. Les 
bijections jouent un rôle très important en 
théorie des ensembles (construction des 
cardinaux par exemple) ; du point de vue 
de la théorie des ensembles proprement 
dite, on peut « identifier » des ensembles E 
et F tels qu’il existe une bijection de E sur 
F (ce que avons fait plus haut pour le plan 
et R X R). 

Si/: E — ► F est une bijection, pour tout 
élément y G F il existe un unique élément 
x G E tel que y =f(x) ; la propriété du 
couple (u, v) G F X E : 

« =m 

est une relation sur F X E qui est en 
fait une bijection de F sur E. En effet, 
puisque f est une bijection, pour tout 
u G F il existe un unique élément V G E 
ayant pour image u ; la bijection ainsi 
définie est appelée la bijection réciproque 
de la bijection / notée C’est donc une 
application de F dans E, et on a la 
caractérisation : 

u = /(v), vGE«v =/-i( w ), uG F. 

On disait autrefois que f ou f~ x établis- 
saient une correspondance biunivoque 
entre E et F ; en effet, les formules 
précédentes associent deux à deux les 
éléments de E et ceux de F. Remarquons 
que l’on peut composer / 1 o / et f o f 1 ; 
on obtient ainsi respectivement les 
applications identiques (c’est-à-dire la 
relation d’égalité) dans E et F respective- 
ment. 

Dans le premier exemple du paragra- 
phe « Composition des applications », 
l’application go f est une bijection de 
E = {a, b , c } sur G = (1, 2, 3} ; l’appli- 
cation réciproque serait : 

1 2 *— ► c, 3 *-+a. 


Relations 

d'équivalence 

On appelle relation d’équivalence sur un 
ensemble E une relation sur E qui est 
réflexive, symétrique et transitive. Si une 
relation d’équivalence donnée est vraie 
pour un couple (x, y), on dit que ces 
éléments sont équivalents (modulo la rela- 
tion considérée) et on note x — ■ y. 

Exempl es 

(1) Sur l’ensemble E = {1, 2, 3, 4}, consi- 
dérons la relation « x }' est un multiple 
de 3 » (dans les entiers relatifs). On vérifie 
facilement que c’est une relation d’équi- 
valence ; la figure 20 représente le dia- 
gramme sagittal de cette relation. 



(2) Voici un exemple plus général (en 
fait, toutes les relations d’équivalence peu- 
vent être obtenues ainsi). Soit / : E — ► F 
une application d’un ensemble E dans un 
ensemble F. La relation sur E : 

x % y&f(x) =/(y) 

est une relation d’équivalence dite associée 
à l application / 

(3) La donnée d’une « fraction » pjq 
équivaut à la donnée de son numérateur p , 
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qui est un entier relatif quelconque, et de 
son dénominateur, qui est un entier relatif 
non nul, c’est-a-dire qu’elle équivaut à la 
donnée du couple (/?, q),p G Z et q E Z*= 

Z — {0}. Dans ce qui suit, nous identifie- 
rons donc l’ensemble des fractions à 
l’ensemble produit Z X Z *. Sur cet 
ensemble, la relation : 

( p> q) ~ (p'> q’) « pq' = pq 

(le produit des « extrêmes » est égal au 
produit des « moyens ») est une relation 
d’équivalence. 

(4) Sur l’ensemble des droites du plan, 
la relation D//D', qui exprime que les 
droites D et D’ sont parallèles ou confon- 
dues, est une relation d’équivalence. 

(5) Sur l’ensemble des « vecteurs » du 
plan, c’est-à-dire des couples de points du 
plan (origi ne, e xt rémité ), la relation d' équi- 
pollence « AB — CD si les segments AD et 
BC ont même milieu » est une relation 
d’équivalence. 

Ensemble quotient 

Soit E un ensemble muni d’une relation 
d’équivalence. Pour tout élément x E E, 
on appelle classe d'équivalence d e x 
l’ensemble, noté C, ou x, des éléments de 
E qui sont équivalents à x ; c’est le 
sous-ensemble de E : 

C* = iyeE;y~x} 

qui est toujours non vide, car il contient X 
(réflexivité). 

Remarquons que tous les éléments 
d’une même classe d’équivalence sont 
équivalents entre eux et que deux éléments 
équivalents ont des classes égales (symétrie 
et transitivité de la relation d’équivalence). 

Il en résulte que si deux éléments x et y ne 
sont pas équivalents, leurs classes d’équi- 
valence sont disjointes, c’est-à-dire n’ont 
pas d’élément commun. 


Puisque les classes d’équivalence sont 
des sous-ensembles de E, l’ensemble de ces 
classes d’équivalence est un sous-ensemble 
de l’ensemble !J“ (E) des parties de E ; on 
appelle ensemble quotient de E par la rela- 
tion d’équivalence considérée ce SOUS- 
ensemble de f/“ (E), qui admet pour 
éléments les classes d’équivalence. Remar- 
quons que l’ensemble quotient est une 
partition de l’ensemble E : les classes d’équi- 
valence sont toutes non vides, et tout élé- 
ment de E appartient à une classe d’équi- 
valence et une seule, la sienne (et celle de 
tous les éléments qui lui sont équivalents). 
Réciproquement, si C S(E) est une par- 
tition, on peut lui associer la relation 
d’équivalence : « x et y appartiennent au 
même sous-ensemble de la partition » ; 
bien entendu, on retrouve comme ensem- 
ble quotient par cette relation d’équiva- 
lence la partition initiale, la classe d’un 
élément étant ici l’unique ensemble de la 
partition auquel il appartient. 

Reprenons, avec ces nouvelles notions, 
les exemples que l’on vient de donner. 
Dans l’exemple (1), on a : 

C 1= C 4 = {1, 4], C 2 = C 5 = {2,5}, C 3 = {3}; 

ainsi l’ensemble quotient contient trois 
éléments, qui sont {1,4}, {2, 5} et {3}. Les 
exemples (3) à (5) montrent comment une 
relation d’équivalence permet de définir de 
nouveaux objets mathématiques. Dans (3), 
toutes les fractions équivalentes entre elles 
correspondent au même nombre ration- 
nel ; par définition , on appellera nombre 
rationnel tout élément de l’ensemble quo- 
tient : on a ici une construction mathéma- 
tique rigoureuse des nombres rationnels à 
partir des entiers relatifs. Les exemples (4) 
et (5) permettraient de définir mathéma- 
tiquement les notions de direction de 
droite et de vecteur libre respectivement. 
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Représentants 

Si C est un élément de l’ensemble quotient, 
on appelle représentant de cette classe tout 
élément x G C, c’est-à-dire tout élément de 
E tel que C v = C. Comme il est souvent 
plus facile de manipuler les éléments de E 
que les éléments de l’ensemble quotient, il 
est intéressant de trouver des représentants 
de toutes les classes d’équivalence, « sans 
omission ni répétition ». Un SOUS- 
ensemble S de E est appelé un système 
complet de représentant si tout élément de 
E est équivalent à un élément de S et à un 
seul. Ainsi, dans l’exemple (1) ci-dessus, on 
peut prendre S = { 1, 2, 3}. 

Examinons l’exemple (2). Une fraction 
p/q sera dite irréductible si q > 0 et si p et 
q sont premiers entre eux. Les propriétés 
élémentaires des entiers montrent que 
chaque classe d’équivalence contient une 
fraction irréductible et une seule, toutes les 
fractions équivalentes étant de la forme 
kp/kq, k G Z * ; ainsi, les fractions irréduc- 
tibles forment un système complet de 
représentants des nombres rationnels. 

Dans l’exemple (5), fixons un point 0 
du plan ; dans chaque vecteur libre, il 
existe un vecteur et un seul d’origine 0 (ce 
qu’on exprime dans le langage usuel en 
disant que le choix de son origine déter- 
mine complètement un vecteur libre) ; 
ainsi les vecteurs d’origine 0 forment un 
système complet de représentants des vec- 
teurs libres du plan. 

JEAN-LUC VERLEY 
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ENSEMBLES ORDONNÉS 

- ORDONNÉS ENSEMBLES 


ÉQuAtioNs ALGÉBRIQUES 


D ès la plus haute antiquité, on ren- 
contre, à l’occasion de problèmes 
concrets, des exemples de résolution 
d’équations du premier et du second 
degré, et, jusqu’au début du XIX e siècle, 
l’étude des équations constitue l’unique 
préoccupation des algébristes. 

Le développement de la théorie est 
étroitement lié aux extensions successives 
de la notion de nombre : introduction des 
nombres négatifs, des nombres irration- 
nels, tandis que les formules de résolution 
de l’équation du troisième degré allaient 
conduire les algébristes italiens du XVI e siè- 
cle à raisonner sur les nombres imaginaires 
(cf. nombres complexes). 
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Par analogie avec le cas des équations 
de degré inférieur ou égal à 4, les algé- 
bristes pensèrent que toute solution d’une 
équation pouvait s’exprimer par des radi- 
caux portant sur les coefficients de l’équa- 
tion. Par un hasard de l’histoire des 
sciences, les tentatives pour établir cette 
conjecture, pourtant mathématiquement 
saugrenue, allaient conduire à dégager les 
premières structures abstraites et être à 
l’origine de l’algèbre moderne (cf. ALGÈ- 
BRE). 


1. Équations affines 

On étudiera en premier lieu le développe- 
ment historique des systèmes d’équations 
affines. 

Premier exemple 

Problème 69 du Papyrus Rhind (Égypte), 
vers 1700 avant notre ère : « Trois bois- 
seaux et demi de farine sont transfor- 
més en 80 pains. Dis-moi combien chaque 
pain contient de farine et quelle est leur 
force. » 

Rappelons que le boisseau (hequt) 
mesure environ 4,5 litres. Il est divisé en 
1/2, 1/4, 1/8, 1/16, 1/32, 1/64 de boisseau 
et contient 320 « ros » (ou parties). La 
« force » d’un pain est la quantité de 
pains que peut fournir un boisseau de 
farine. Si x est cette force et si y est la 
quantité de farine contenue dans un pain, 
x et y sont avec les mêmes unités - 
inverses l’un de l’autre. Le texte donne 
pour la force : 


et, pour la quantité de farine contenue 
dans un pain, 3 boisseaux et demi divisés 
par 80, ou 1 120 ros divisés par 80, 

donnent 1/32 de boisseau et 4 ros. 

C’est un problème très élémentaire du 
type ax = b ou a = by. Toute la difficulté 
provient, au point de vue concret, du choix 
des unités de mesure et de leurs subdivi- 
sions, et, au point de vue abstrait, du calcul 
égyptien des fractions. Dans ce calcul, la 
notion de fraction générale n’est pas 
encore dégagée, ou, en langage actuel, 
P ensemble Q 4 " n’est pas mis en évidence. 
A part la fraction 2/3, l’Égyptien ne calcule 
que par quantièmes ou fractions de numé- 
rateur 1. Ces errements se prolongeront 
très longtemps dans les littératures mathé- 
matiques grecque (collection héronienne), 
byzantine et occidentale. 

Deuxième exemple 

On peut trouver en Égypte des problèmes 
plus savants que le précédent, qui se 
ramènent au même type d’équation. Pre- 
nons cependant, dans la mathématique 
babylonienne, un deuxième exemple à peu 
près contemporain du précédent 
(E. Bruins et M. Rutten, Textes mathéma- 
tiques de Suse) : « Un quart de la largeur, 
ajoute à la longueur : 7 mains... à 10... 10 
c’est la somme. Largeur ? » En désignant 
la longueur par x, la largeur par y, on 
obtient le système x + y/4 = 7 ; 
x — {— y = 10. Voici la solution donnée dans 
la tablette : « Porte 7 à 4 du « quart » : 28 
tu trouves ; tu soustrais 10 de 28 : 18 tu 
trouves. Dénoue l’inverse de 3 : 20 tu 
trouves ; porte 20 à 18 : 6 tu trouves : 6 la 
longueur ; tu soustrais 6 de 10 : 4, la 
largeur.. » 

Ce système de deux équations à deux 
inconnues est résolu suivant un procédé 
encore utilisé dans notre enseignement 
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élémentaire. La numération utilisée est 
à base 60. La division est remplacée par 
la multiplication par l’inverse du divi- 
seur. 

Troisième exemple 

La littérature chinoise offre, dans le même 
ordre d’idées, des exemples ultérieurs, 
parmi lesquels le suivant, extrait de Neuf 
Chapitres sur l'art du calcul , ouvrage qui se 
situe dans les deux derniers siècles avant 
notre ère. « Les poids de deux gerbes d’une 
récolte A, de trois gerbes d’une récolte B, 
de quatre gerbes d’une récolte C sont 
supérieurs à une unité de poids. Deux 
gerbes A valent, en sus de l’unité, une 
gerbe B. Trois gerbes B valent, en sus de 
l’unité, une gerbe C, et quatre gerbes C, 
une gerbe A. Quel est le poids d’une gerbe 
de chaque récolte ? » 

Le système d’équations à résoudre peut 
s’écrire : 

2x = 1 + y;3 t y= 1 + z ; 4z = 1 + x ; 

ou : 

2 x—y = 1 ; 3 y—z= 1 ; 4z — jc - 1 . 

Le calculateur chinois dispose sur un 
échiquier trois colonnes qui vont repré- 
senter les trois équations. Sur la pre- 
mière à droite, il place en première ligne 
deux bâtonnets de couleur (2.y), en deu- 
xième ligne un bâtonnet noir (— y), en 
quatrième ligne un bâtonnet de couleur : 
1 unité. 


— 1 


2 


3 

— 1 

4 

- 4 - 1 


1 

1 

11 


Il procède de façon analogue pour les 
autres colonnes. Doublant la colonne de 


gauche et lui ajoutant celle de droite, il 
arrive à la nouvelle disposition : 




2 

— 1 

3 

— 1 

8 

— 1 


3 

1 

1 


Triplant la nouvelle colonne de gauche 
et lui ajoutant la colonne centrale, il obtient 
la disposition : 




2 


3 

— 1 

23 

—1 


DOD 

E 

1 


On voit ainsi que 23 z — 10, et z — 
10 / 23 , puis 3 j - 10/23 = 1, d’où y — 
1 1 / 23 , et 2 AT — 1 1/23 = 1 , d’où x = 17 / 23 . 

Cette solution, très remarquable, néces- 
site que tous les coefficients dans les 
équations soient des nombres entiers. Elle 
implique la connaissance des nombres 
négatifs. L’ouvrage d’où elle est extraite 
donne d’ailleurs les règles des signes pour 
les deux opérations fondamentales. Enfin 
le calculateur tilise les fractions dans leur 
généralité. En résumé, les mathématiciens 
chinois travaillaient, pour les systèmes 
d’équations affines, sur le corps Q des 
nombres rationnels. 

Simple et double fausses positions 

On trouve, dans Neuf Chapitres sur l’art du 
calcul, nettement expliquées, les deux 
règles de la fausse position simple, et de la 
double fausse position : lorsqu’un pro- 
blème conduit pour nous à une équation 
ax = le calculateur, qui ne dispose pas 
du calcul littéral, est souvent très gêné pour 
trouver le coefficient a. S’il connaît le 
terme il effectue, sur une « fausse 
position » à'o mise à la place de l’inconnue 


319 






Équations ALGÉBRIQUES 


x, tous les calculs proposés dans le pro- 
blème. Il obtient ainsi une valeur b 0 telle 
que üXq — bÿ. Il ne lui reste plus qu’à 
résoudre la « proportion » : 


Dans d’autres cas plus compliqués, il lui 
est difficile de calculer les deux coefficients 
U et b. Une première position x 0 donne 
UXq — b - /q r§ est l’erreur. Une seconde 
position Xj donne «Xj b - r { ; est une 
seconde erreur. Les facteurs a et b ne sont 
pas connus, mais les quatre nombres x 0 , Xj, 
r 0 , le sont. 

Le calcul de x se fait alors par annula- 
tion du déterminant : 

jc 0 1 
*o *0 1 
x, r, 1 

c’est-à-dire que : 

_ x 0 r l —x 1 r g 
'■î — i-o 

Bien attestées dans l’ancienne mathé- 
matique chinoise, les règles de fausse 
position sont connues des Arabes et de 
l’Occident sous le nom d’al-khatayn (la 
chinoise). Elles existent toujours : c’est 
l’interpolation linéaire. 

Indiquons enfin que les systèmes 
d’équations affines se rencontrent dans la 
littérature grecque, principalement chez 
Diophante d’Alexandrie (m e siècle env.). 
Ce n’est d’ailleurs qu’un aspect mineur de 
l’œuvre du grand algébriste. Diophante ne 
procède pas par fausses positions. Il utilise 
une inconnue, pour laquelle il dispose 
d’une notation et d’une dénomination. 

tes algébristes de la Renaissance 

Au XV e siècle, l’Italien Pacioli (1494) et le 
Français Nicolas Chuquet (1484). entre 


autres, s’intéressent particulièrement aux 
systèmes d’équations affines. Le premier 
de ces deux algébristes utilise parfois une 
inconnue privilégiée, la cosa, et parfois 
même une seconde, la quantita. Cela lui 
permet la résolution de systèmes à plu- 
sieurs inconnues. 

Chuquet note l’inconnue l 1 et résout à 
notre façon les problèmes affines à une 
seule inconnue. Pour les problèmes à 
plusieurs inconnues, en plus des méthodes 
traditionnelles, il lui arrive d’introduire 
soit une, soit deux inconnues privilé- 
giées notées alors respectivement 1’ et 1’. 
D’autre part, Chuquet utilise habile- 
ment les nombres négatifs. Il rejoint en 
cela les algébristes chinois et indiens, 
dépassant de beaucoup les quelques essais 
timides des savants occidentaux en la 
matière. Il faut cependant citer, parmi ses 
précurseurs en ce domaine, Léonard de 
Pise (XIII e siècle). 

En cette fin du XV e siècle toutefois, la 
distinction entre systèmes déterminés et 
indéterminés n’est pas claire. En particu- 
lier, on ne voit pas précisément si le 
problème doit, pour être possible et déter- 
miné, contenir plus, autant ou moins 
d’équations que d’inconnues. 

Le XVI e siècle apporte des progrès 
appréciables. L’Allemand Michael Stifel 
(1487-1567) note en 1544 l’inconnue d’un 
signe particulier analogue à r, mais, 
lorsqu’il se présente d’autres inconnues, il 
les désigne par les premières lettres de 
l’alphabet A, B, etc. Les données sont bien 
entendu numériques (appartenant à Q’). 
Il est imité, en France, par Jacques Peletier 
(1517-1582) dans son Algèbre, de 1554. 
Jean Borrel, ou Buteo (1492-1572), est plus 
net encore en 1559. Soit à résoudre le 
problème : « Etant donné une somme 
quelconque, trouver trois nombres dont le 
premier avec la moitié, le second avec le 
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tiers, le troisième avec le quart des autres 
font chacun cette somme. » Il désigne les 
nombres par A, B, C, et, 17 étant la 
somme, il écrit : 

1 A,1b,1c[17; 

2 2 

1 B, t A, ^ C [17 ; 

1çJa,Ib[17; 

d’où : 

2 A . 1 B . 1 C [34 ; 

1 A . 3 B . I C [51 ; 

1A.1B.4C [68. 


2. Le second degré 

L’histoire des équations quadratiques : 
ax l + bx -f c — 0 

remonte, comme celles des équations affi- 
nes, à des époques très reculées. La mathé- 
matique égyptienne n’a pratiquement rien 
découvert en ce domaine. Au contraire, 
l’on doit beaucoup, l’essentiel même, aux 
Babyloniens. 

Premier exemple 


Procédant alors exactement à la 
chinoise, il résout très clairement le sys- 
tème. 

Lorsque dans un système affine les 
données sont rationnelles et les inconnues, 
par leur nature, entières, le système est dit 
diophantien. II est généralement impossi- 
ble si le nombre des équations est égal ou 
supérieur à celui des inconnues. Dans le 
cas où il y a moins d’équations que 
d’inconnues, il est indéterminé. La pre- 
mière étude scientifique des systèmes affi- 
nes diophantiens est due à Bachet de 
Méziriac, en 1624. Il montre en particulier 
que, si les entiers a et b sont premiers entre 
eux, il existe des entiers x et y tels que 
ax + by = 1. 

À part cela, le XVII e siècle apporte peu 
dans la théorie des équations affines, sinon 
le développement par Descartes du calcul 
littéral de Viète. Cependant Leibniz entre- 
voit le calcul matriciel. Au siècle suivant, le 
Suisse Gabriel Cramer (1704-1 752) fait la 
première étude exhaustive des systèmes 
d’équations affines (1750). Avec le XIX e siè- 
cle apparaît le calcul des déterminants, 
puis le calcul matriciel. Ces problèmes sont 
à l’origine de l’étude des espaces vectoriels 
et de toute l’algèbre linéaire. 


Sur une tablette de l’ancien âge babylonien 
(YBC 4663), on demande de trouver un 
rectangle, connaissant son demi-périmètre, 
6” 30', et son aire, 7” 30’. 

Il s’agit donc de résoudre le système : 

x + y = 6° 30', 
xy = 7° 30’. 

Voici la méthode proposée par le 
scribe (numération à base 60) : prendre 
la moitié de la longueur et de la lar- 
geur : 


élever au carré : 



10033’45”; 


en retrancher l’aire : 



— xy = 303’45” ; 


prendre la racine carrée : 1” 45’ ; ajouter la 
demi- somme : 

3° 15’ + 1° 45’ = 5° ou æ ; 


retrancher : 

30 15 ’ 1 ° 45’ = 1° 30' ou y- 
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Second exemple 

Problème 7 de la tablette BM 13901. 
remontant à l’ancien âge babylonien, 
1800 environ avant notre ère : « J’ai 
additionné sept fois le côté de mon carré 
et onze fois la surface : 6° 15’. » Soit 
Il X 2 + 1 X = 6° 15’. 

Solution : « Tu inscriras 7 et 1 1 . Tu 
porteras 11 à 6° 15’ : f 8°45\ Tu frac- 
tionneras en deux 7 : 3° 30’. Tu croiseras 
3° 30’ et 3° 30’ : 12°15'. À Y 8°45' tu 
ajouteras T 21°, qui est le carré de 9. Tu 
soustrairas 3° 30', que tu as croisé, de 9 : 
tu inscriras 5° 30’. L’inverse de 11 ne peut 
être dénoué. Que dois-je poser à 11 qui me 
donne 5° 30’ : 30% son quotient. Le côté du 
carré est 30’. » 

À savoir : l’équation à résoudre est ax 2 
+ bx = c. On calcule b 2 / 4, puis b 2 / 4 + ac , 
dont la racine est V(/r/4 -j- ac) . On forme 
V^/r/d + ac) b/2 . Le coefficient a 
n’ayant pas d’inverse dans l’anneau 
des nombres exprimables en base 60, 
on divise par a, par tâtonnements, 
V(/r/4 -|- ac) b/2. Le quotient est le côté 
cherché. La numération est sexagésimale : 

V + 60°, et r — (1/60). 1°. 

D’autres exemples, fort nombreux, 
montrent que le calculateur babylonien sait 
résoudre toutes les équations quadrati- 
ques. Il y a pourtant un obstacle : ce 
calculateur ne s’exprime pas dans R, corps 
des réels, mais dans un sous-anneau, celui 
des nombres exprimables d’une façon 
finie, en base 60. Pour que ax 2 + bx + c 
= 0 ait des racines, il ne suffit donc pas que 
b 2 — ■ 4 ac ^ 0, mais il faut encore que cette 
quantité soit le carré d’un élément de 
l’anneau et que, de plus, la division finale 
par a soit possible dans l’anneau. 

Les Grecs font, de la résolution des 
équations du second degré, la base même 
de toute leur géométrie. Mais, pour pou- 


voir travailler dans R, ils remplacent les 
calculs babyloniens par des constructions à 
la règle et au compas. Pour qu’une équa- 
tion quadratique ait alors des racines, il 
suffira que b 2 — 4 ac ^ 0. 

Le fait de construire les solutions des 
problèmes à partir des segments donnés, à 
la règle et au compas, conduit les géomè- 
tres grecs à l’étude des binômes, segments 
dont les mesures sont de la forme Væ + 
Vb, a et b rationnels. Cette étude savante 
n’aboutit guère à des conclusions définiti- 
ves. Elle occupe cependant une grande 
partie des Eléments d’Euclide et joue un 
rôle important dans le développement de 
la théorie des équations. Cependant les 
algébristes grecs calculent dans Q, plus 
précisément dans Q + . Pour eux, une 
condition supplémentaire s’impose : b 2 
4 ac doit être le carré d’un rationnel. 
Toute l’algèbre diophantienne trouve là 
son origine. Elle est tenue à manipuler des 
équations indéterminées où certaines 
expressions doivent être des carrés parfaits 
dans Q. L’extraordinaire habileté de Dio- 
phante en ce domaine sera un très puissant 
stimulant pour les mathématiques des XVI e 
et XVII e siècles. 

Les Arabes et leurs disciples occiden- 
taux jusqu’au XVI e siècle n’apportent rien 
d’essentiel. La nécessité de calculer dans 
Q + ou dans R + les conduit au contraire à 
distinguer dans les équations quadratiques 
de multiples cas, assez inutilement. Tout au 
plus savent-ils que l’équation peut, parfois, 
admettre deux racines (positives). 

3. Équations de degré 3 et 4 

tes équations cubiques 
Quelques exemples d’équations cubiques 
apparaissent chez les Babyloniens, mais 
sans rien de systématique. Archimède 
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discute (De lu sphère et du cylindre, livre 
second) les problèmes qui, pour nous, 
conduisent à l’équation cubique générale. 
Mais sa démarche est purement géométri- 
que et ne peut pas se traduire en algèbre. 
Le XV e siècle connaît quelques tentatives 
malheureuses de résolution algébrique. Il 
était réservé à l’école italienne du XVI e siè- 
cle d’apporter la solution définitive. Les 
trois pionniers sont successivement Sci- 
pione del Ferro, Tartaglia et Cardan. 

L’équation générale se ramène à des 
formes telles que X 3 + px + q — 0. (Les 
algébristes n’écrivant que des coefficients 
numériques et positifs, trois cas sont à 
distinguer : x 3 = x + 1, x 3 + X = 1 et 
-V 3 + 1 = x. ) 

La solution trouvée se résume pour 
nous dans la formule : 



Elle est obtenue en posant x = U -f- v, 
puis w 3 + v 3 = q, UV = pj 3, d’où + 
V 3 = g, H-V — P 3 /27 ; W 3 et V 3 sont 

donc racines d’une équation quadratique. 

Cardan comprend aussitôt les diffi- 
cultés soulevées par cette solution. Lors- 
que q 2 / 4 + /? 3 /27 est négatif, les nombres 
U et V ne peuvent pas être calculés dans R, 
donc n’existent pas. Or, Archimède a 
montré que, dans ce cas, l’équation cubi- 
que proposée a des racines, et Cardan, en 
acceptant les racines négatives, sait en 
outre qu’elle en a trois. Pour lever la 
difficulté, il introduit timidement, et Boiîl- 
belli le fera plus nettement en 1572, de 
nouveaux nombres dits « impossibles » ou 
« imaginaires ». Ainsi apparaît, pour la 
première fois, le corps C des nombres 
complexes. 


Équations ALGÉBRIQUES 
Le quatrième degré 

Un disciple de Cardan, Ferrari, résout 
l’équation du quatrième degré. Soit par 
exemple à résoudre je 4 -}— 6 x 2 -J- 36 — 
60 x. Ajoutons 6 x 2 aux deux membres 
pour que le premier soit un carré parfait. 
11 vient (x 2 + 6) 2 = 6 x 2 + 60 x. Formons : 

(x 2 + 6 +x) 2 = (x 2 + 6) 2 + 2 y{x 2 +6) + y 2 . 

L’équation s’écrit : 

(x 2 + 6 +yy = (6 + 2y)x 2 -F 60x + 12 y + y 2 . 

Si le trinôme en x du second membre est 
un carré parfait {üX -j- b ) 2 , l’équation se 
ramènera au second degré : x 2 +- 6 + y 
= ax -j- b. Pour cela, il faut que : 

900 — (6 + 2y)(\2y +y*) = 0. 

Le paramètre y est donc obtenu par la 
résolution d’une équation cubique. C’est 
Bombelli qui, en 1572, étend le procédé de 
Luigi Ferrari à l’équation la plus générale 
de degré 4. 

L’obligation de n’avoir dans les équa- 
tions que des coefficients positifs rend la 
démarche de ces auteurs fort pénible. 

4. La théorie « générale » 

des équations 

Grâce à l’école italienne, la théorie géné- 
rale des équations algébriques se précise et 
ses problèmes principaux se dégagent. 
Sans suivre chronologiquement son déve- 
loppement historique, on peut s’efforcer 
d’en mettre en évidence les points impor- 
tants. L’équation étant mise sous la forme 
P(x) = 0, l’importance du degré du poly- 
nôme P, ou degré de l’équation, apparaît 
d’abord ; en effet, l’équation n’a pas en 
général une seule racine, comme le vou- 
laient les anciens algébristes, mais peut en 
avoir jusqu’à n , si H est son degré. 
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Si a est une racine, alors P(x) est 
divisible par .y a et l’on peut écrire : 

?(x)={x-a)Q{xl 

Q étant un polynôme de degré n 1. 

Si l’équation admet exactement n raci- 
nes, il est possible d’exprimer les coeffi- 
cients du polynôme P(x) par des fonctions 
symétriques rationnelles entières des raci- 
nes. 

Exemple du second degré : 

x 2 — px + q = 0, 

de racines a et b ; alors : 

(x — a)(x — b) =x 2 —px + q; 
p = (a + b) ; q = ab. 

Exemple du troisième degré : 
x 3 — px 2 + qx — r = 0, 
de racines a, b , c ; 

{x — a)(x — b)(x — c) =x 3 — px 2 + qx — r ; 
p = a + b + c ; q — ab + ac + bc ; r = abc. 

Exemple du cinquième degré : 

x i ~ px* + qx 3 — rx 2 + sx — t = 0, 

de racines a, h, c\ d , e ; 

p=a+b+c + d+e, 
q = ab + ac + ad + ae 

+ bc + bd + be + cd + ce + de, 
r = abc + abd + abe + acd + ace + ade 

+ bcd + bce -h bde + cde, 

S = a bcd + a bce + abde + cote + bcde f 
t = abccfe. 

Ces relations apparaissent déjà chez 
Viète, dans le seul cas où toutes les racines 
sont positives, mais c’est Harriot, en 1630, 
dans ses œuvres posthumes, et surtout 
Albert Girard, en 1629, qui leur donnent 
toute leur extension. Girard, d’autre part 
et il sera suivi par Newton exprime les 


sommes des puissances des racines en 
fonction des coefficients : 

a+b + c + d + e=p, 
a 2 + b 2 + c 2 + d 2 + e 2 = p 2 — 2q, 
a 3 + b>+ c 3 + rf 3 + ^ —p 1 — ipq + 3 r, 
a 4 + b 4 + c 4 + d 4 + e 4 

— p 4 — 4pig _|_ 4p r + 2ç 2 — 45. 

L’étude des fonctions symétriques des 
racines se développe considérablement au 
XVIII e siècle avec Waring, au XIX e avec 
Cauchy, etc. 

Ces belles relations ne sont évidemment 
établies, chez Viète, que lorsque toutes les 
racines sont positives, et, pour tout algé- 
briste, que si elles existent. Tout dépend du 
sens donné au mot «existence », Pour 
Jean de Beaugrand par exemple, vers 
1638, exister est synonyme d’« appartenir 
à l’ensemble R des réels ». Pour Girard, on 
peut admettre des « solutions impossi- 
bles » pour la « certitude de la règle 
générale et pour son utilité ». Pour Des- 
cartes, en 1637, « les racines ne sont pas 
toujours réelles, mais quelquefois seule- 
ment imaginaires, c’est-à-dire qu’on peut 
bien toujours en imaginer autant que j’ai 
dit en chaque équation, mais qu’il n’y a 
quelquefois aucune quantité qui corres- 
ponde à celle qu’on imagine ». Il semble 
bien que ce soit Peter Roth de Nuremberg 
qui ait, le premier, en 1608, énoncé cet 
aphorisme hardi : « Une équation a autant 
de racines qu’il y a d’unités dans son 
degré. » Cette conclusion est une consé- 
quence des principes énoncés par Bom- 
bclli, sans leur être identique. Cet algé- 
briste italien introduit A/— 1 , qu’il adjoint 
aux nombres réels, créant ainsi le corps C 
des nombres complexes. Il peut alors 
retrouver les racines réelles de l’équation 
cubique dans le cas dit « irréductible ». 
Roth, suivi par Girard et Descartes, puis 
par la grande majorité des mathémati- 
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tiens, décide, très arbitrairement, l’exis- 
tence d’êtres fictifs, n’appartenant pas à 
l’ensemble R des nombres réels (et dont on 
ignore s’ils appartiennent ou non à C), et 
étend à ces êtres les algorithmes classiques 
de calcul. Jusqu’en 1746, on maniera ainsi 
des êtres imaginaires, sans trop savoir 
quelle pourrait bien être leur structure. 
Cependant la conviction se répandait de 
plus en plus qu’ils étaient de la forme 
a + b V— 1 . C’est ce que d’Alembert 
établit cette année-là, en s’appuyant sur le 
calcul infinitésimal et la géométrie analy- 
tique et en admettant le principe d’exis- 
tence des n racines d’une équation de 
degré n. Daviet de Foncenex, Lagrange, 
Laplace améliorèrent cette démonstration, 
mais en se fondant toujours sur le même 
principe. Gauss, en 1799, qualifia de cercle 
vicieux cette démarche et il fournit enfin 
plusieurs preuves rigoureuses du « théo- 
rème fondamental de l’algèbre », ou 
« théorème de d’Alembert ». 

On sait aujourd’hui que l’attitude des 
géomètres du XVIII e siècle peut se justifier 
en ce domaine, et cela, grâce à la théorie 
des congruences de Gauss et à l’introduc- 
tion par Galois du corps de rupture. 
Précisons en quelques mots. Soit un corps 
K, commutatif, et un polynôme P(x), 
indécomposable sur K en un produit de 
deux polynômes (premiers sur K). Alors 
l’anneau des polynômes construits sur K se 
subdivise en classes d’équivalences : deux 
polynômes R(x) et S(x) sont équivalents si 
leur différence est divisible par P(x). On 
démontre que ces classes d’équivalence 
forment un corps commutatif. Désignant 
par a la variable désignée par x jusqu’ici, 
tous les éléments du corps sont des poly- 
nômes en a à coefficients dans K. 

Dans ce nouveau corps, P(a) = 0 ; 
autrement dit, P(x) admet la racine a et est 
divisible par x — Cl. 


ÉQUATIONS ALGÉBRIQUES 

Exemple. En prenant, pour P(x), 
X 2 + 1 , et, pour K, le corps R des réels, et 
en notant / ce que nous notions a, on 
trouve le corps des complexes où 
X 2 + 1 = (x + /) (x — i). Cette construc- 
tion du corps des nombres complexes a été 
proposée par Cauchy. 

De ce point de vue, la démarche des 
précurseurs de Gauss était correcte. Le 
seul point à établir était de montrer que, 
pour K = R, P(x) premier quelconque, le 
corps de rupture est un sous-corps de C. 


5. Résolution numérique 

Pour une équation P(x) = 0, les questions 
suivantes se sont posées naturellement : 
Combien a-t-elle de racines réelles ? Com- 
bien d’imaginaires ? Combien de positives, 
de négatives ? Quelles sont les valeurs 
approchées, au 1/10, au 1/100, au 1/1000 
près, etc. de ces diverses racines? 

Descartes, dans sa Géométrie de 1637, 
déclare, sans preuves, que l’équation 
P(x) = 0 peut avoir autant de racines 
réelles positives qu’il y a de changements 
de signe dans les monômes du premier 
membre ordonné, et autant de négatives 
qu’il y a de permanences. 

Ainsi x 4 + x 3 — x 2 + x + 1 =0 peut 
avoir deux racines positives et deux racines 
négatives. En fait, cette équation n’a 
aucune racine positive et deux racines 
négatives, les deux autres étant imaginaires 
conjuguées. On énonce aujourd’hui le 
théorème de Descartes comme il suit : 
Dans une équation quelconque, à coeffi- 
cients réels, le nombre des racines positives 
ne surpasse pas le nombre des variations 
de signe du premier membre ; et, quand il 
est moindre, la différence est toujours un 
nombre pair. 
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En 1690, Rolle (16.52-1719) énonce 
dans son Algèbre une proposition que l’on 
peut exprimer ainsi : Soit P(x) “ 0, for- 
mons l’équation P’(x) = 0, P’ étant le 
polynôme dérivé du polynôme P. Entre 
deux racines de la première équation, il 
existe au moins une racine de la seconde. 

Le théorème de Budan (18 11) se ratta- 
che au même ordre d’idées : « Étant donné 
une équation P(x) = 0 de degré m, si dans 
les (m + 1) fonctions P(x), P’ (x), P”(x), 

. ..) P (m )(;c) où chacune est la dérivée de la 
précédente, on substitue à x deux nombres 
a et p (a < p), et, si après chaque 
substitution on compte les variations de 
signe que présente la suite des résultats, le 
nombre des racines de P(x) = 0 comprises 
entre a et P ne surpasse jamais celui des 
variations perdues de a à P, et, quand il est 
moindre, la différence est toujours un 
nombre pair. » 

Le théorème de Sturm (1829) est le 
résultat le plus précis qui ait été obtenu 
dans ce domaine. Soit P(x) = 0 l’équation 
proposée. On divise P par le polynôme 
dérivé P’. Soit P 2 le reste euclidien changé 
de signe. Divisons P’ par P 2 , et soit P 3 le 
reste changé de signe, etc. Si m est le degré 
de P, supposé sans racines multiples, consi- 
dérons la suite P, P’, P 2 , P 3 , . . . . P OT . Soit 
alors, comme dans le théorème de Budan, 
a et p (a < p) deux nombres donnés. 
Formons P(a), P’ (a), .... P,„(a), et de 

même P(P), P'(P), . . . . P„,(|3). 

Le nombre des racines de l’équation com- 
prises entre a et p est précisément égal à 
l’excès du nombre ûes variations de signe 
que présente la première suite sur celui que 
présente la seconde. 

Les théorèmes précédents et quelques 
autres analogues permettent la séparation 
des racines de l’équation. C’est-à-dire que, 
pour chaque racine réelle, on arrive à 
trouver deux nombres a et p entre lesquels 


il n’existe que cette racine de l’équation. À 
partir de là, on peut appliquer les métho- 
des générales de résolution d’une équation 
f(x) = 0 pour obtenir des valeurs appro- 
chées des racines. 


6. La résolution algébrique 
des équations 

Par cette expression, on entend tradition- 
nellement la résolution des équations au 
moyen de radicaux carrés, cubiques, etc. 

On a vu que sont résolubles par ce 
procédé les équations de degrés 2, 3 et 4. 
Après les succès de l’école italienne au 
XVI e siècle, les mathématiciens se sont 
attachés à trouver des formules de résolu- 
tion analogues pour les degrés suivants, 
singulièrement pour le cinquième. Parmi 
les recherches les plus remarquables en ce 
domaine, on peut citer celles de Tschirn- 
haus (16.5 1-1 708). 11 s’efforce, en 1689, par 
un changement de variable, de ramener 
toute équation algébrique à une équation 
binôme. Plus précisément, soit P(x) = 0 
une équation de degré fl. Posons y = Q(x), 
Q étant un polynôme de degré n — 1 
à coefficients indéterminés. On élimine 
x entre les deux équations P(x) = 0 et 
Q(x) y — 0, et l’on détermine les coef- 
ficients du second polynôme de façon à 
faire disparaître, dans l’équation résultante 
en y, certains ou tous les termes intermé- 
diaires. Si la méthode de Tschirnhaus 
réussissait toujours, toute équation serait 
aigébriquement résoluble. A-u XVIII e siècle, 
Euler et Bezout ont étudié le même pro- 
blème par des procédés analogues. 

Un mémoire de Vandermonde, lu en 
novembre 1770, devait inaugurer une ère 
nouvelle. Kronecker n’a pas craint d’affir- 
mer que l’essor moderne de l’algèbre 
commençait avec ce mémoire. Vander- 


326 



ÉQUATIONS ALGÉBRIQUES 


monde y apparaît comme le précurseur et 
le premier ouvrier de la théorie des subs- 
titutions, distinguant, avant Gauss et Abel, 
les fonctions cycliques invariantes par une 
permutation circulaire déterminée et 
décomposant les fonctions symétriques en 
fonctions cycliques, Naturellement, il 
n’aboutit pas pour les degrés 5 et 6, mais 
il montre combien il serait prématuré de 
conclure à l’impossibilité de la résolution 
des équations générales de degré supérieur 
à 4. Puis il note que, si sa méthode échoue 
pour ces équations générales, elle réussit 
pour des équations particulières dont les 
racines sont liées par certaines relations et 
il prend pour exemple Jt 11 — 1 = 0, dont il 
exprime les solutions au moyen de racines 
carrées et de racines cinquièmes. 

Avec Vandermonde apparaît ainsi la 
notion de substitution dans un ensemble 
fini, celui des racines d’une équation algé- 
brique, notion que devaient approfondir 
les algébristes ultérieurs, et dont l’étude 
aboutira, avec Galois, au concept nouveau 
de groupe fini. 

Les idées développées par Vander- 
monde se trouvent encore, indépendam- 
ment d’ailleurs, dans l’important mémoire 
de Joseph Lagrange, lu en 1771 : 

Réflexions sur la résolution algébrique des 
équations. 

Gauss, dans ses Disquisitiones arithme - 
ticae (1801), explicite les remarques de 
Vandermonde sur les équations binômes 
X n 1=0, les appuie solidement sur les 
propriétés arithmétiques de l’exposant et 
montre notamment, à partir de l’équation 
X 17 ^ 1 = 0, la possibilité d’inscrire dans le 
cercle, à la règle et au compas, un polygone 
régulier de 17 côtés. 

Les travaux de Vandermonde, 
Lagrange et Gauss attirèrent en particulier 
l’attention des géomètres sur les fonctions 
entières de plusieurs variables et sur les 


changements qu’elles éprouvent dans une 
permutation de ces variables. Lagrange 
démontra que le nombre des valeurs d’une 
fonction de n lettres est toujours un 
diviseur de n !, produit des n premiers 
entiers. Ruffini (1765-1 822) établit en 1799 
que si une fonction de cinq variables a 
moins de cinq valeurs distinctes, elle ne 
peut en avoir plus de deux. Si ce théorème 
n’établit pas l’impossibilité de la résolution 
algébrique de l’équation générale du cin- 
quième degré, il prouve du moins l’impos- 
sibilité de former une équation auxiliaire 
ou résolvante de degré inférieur à 5. 
Cauchy généralise : Si une fonction de n 
lettres a moins de p valeurs distinctes (p 
plus grand nombre premier contenu dans 
n ), elle ne peut en avoir plus de deux 
(1815). 

Ces diverses propositions nécessitaient 
déjà l’étude de la structure de l’ensemble 
des substitutions de n lettres, en particulier 
celle des substitutions circulaires. 

Abel (1802-1 829), dans le même ordre 
d’idées, avait établi qu’une fonction de 
5 lettres ayant cinq valeurs distinctes est 
symétrique par rapport à 4 lettres. Appli- 
qué à la résolution algébrique des équa- 
tions, ce théorème montrait que, si l’on 
cherche à faire dépendre la résolution de 
l’équation générale du cinquième degré de 
celle d’une résolvante de ce même degré, 
on revient à la transformation de Tschir- 
nhaus. Ruffini énonça en 18 13 l’impossi- 
bilité de la résolution algébrique de cette 
équation générale du cinquième degré. En 
1824 et 1826, Abel apporta sur ce point des 
arguments plus probants. De plus, géné- 
ralisant l’analyse de Vandermonde et de 
Gauss pour les équations binômes, il 
établit que, si deux racines d’une équation 
irréductible sur le corps des coefficients 
sont telles que l’une puisse s’exprimer 
rationnellement par l’autre, l’équation est 
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résoluble par radicaux si son degré est un 
nombre premier, et que, s’il n’est pas 
premier, sa résolution dépend d’équations 
de degrés moindres que le sien. 

Abel, dans son étude de l’équation du 
cinquième degré, se servait du fait que les 
quantités successives dont il faudrait, dans 
cette résolution, extraire les racines 
n-ièmes doivent s’exprimer rationnelle- 
ment en fonction des racines cherchées. Ce 
point présente des difficultés. Galois (18 1 1- 
1832) procède par une démarche diffé- 
rente (1830). En appelant groupe d’une 
équation, sur un corps donné, le groupe 
des permutations de ses racines qui laissent 
inchangées les expressions polynomiales 
des racines dont la valeur appartient à ce 
corps, il montre que, dans une résolution 
par radicaux, et dans les réductions suc- 
cessives que subit, au cours des calculs, le 
groupe de l’équation, chaque nouveau 
groupe est un sous-groupe invariant du 
précédent. Or, le groupe des substitutions 
de cinq lettres n’a pas de sous-groupe 
invariant. Donc la résolution algébrique de 
l’équation générale du cinquième degré est 
impossible. De plus, sa méthode lui permit 
(183 1) de montrer que, pour qu’une équa- 
tion irréductible de degré premier soit 
soluble par radicaux, il faut et il suffit que, 
deux quelconques des racines étant don- 
nées, les autres s’en déduisent rationnelle- 
ment. 

A un point de vue plus élémentaire, 
mais historiquement très important, signa- 
lons le mémoire du mathématicien français 
Pierre Laurent Wantzel (18 14-1848) : 

« Recherches sur les moyens de reconnaître 
si un problème de géométrie peut se résou- 
dre par la règle et le compas » (1837). 
Wantzel y montre pour la première fois, 
d’une façon irréfutable, que, si un pro- 
blème de géométrie conduit à une équation 
de troisième degré, indécomposable sur le 


corps de ses coefficients, ce problème n’est 
pas résoluble à la règle et au compas. Ainsi 
se trouve justifiée la distinction grecque 
entre les « problèmes solides », comme 
ceux de la duplication du cube et de la 
trisection de l’angle, et les « problèmes 
plans », traitables à la règle et au compas. 

JEAN ITARD 
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ERGODIQUE théorie 


E rgodique vient du mot grec ëp'yov qui 
signifie travail. C’est en effet d’un 
problème de mécanique que la théorie 
ergodique est issue. A l’origine se trouve 
une hypothèse de la théorie cinétique des 
gaz, audacieusement posée par L. Boltz- 
mann en 1885, qui permettait aux physi- 
ciens de résoudre une difficulté liée à 
l’étude des systèmes mécaniques à un très 
grand nombre de particules. L’importance 
de cette hypothèse, confirmée expérimen- 
talement dans de nombreux cas, conduisit 
les mécaniciens à en chercher une justifi- 
cation théorique et ce sont les diverses 
tentatives faites dans cette voie qui mar- 
quent les débuts de la théorie ergodique. 

Après les résultats fondamentaux, obte- 
nus par J. von Neumann et G. D. Birkhoff 
en 1931 à quelques semaines d’intervalle, 
la théorie ergodique s’est développée au 
sein de la mathématique dans des direc- 
tions diverses : analyse fonctionnelle et 
théorie des groupes ; calcul des probabili- 
tés et plus précisément processus marko- 
viens ; théorie de l’information, etc. Les 


méthodes ergodiques ont permis d’exposer 
différemment certains problèmes et de 
donner des prolongements nouveaux à ces 
branches de la mathématique. L’étude de 
la théorie ergodique suppose la connais- 
sance de la théorie de la mesure (cf. 
INTÉGRATION ET MESURE). 

& 


1. Le modèle de Poincaré 
et l'hypothèse ergodique 


Pour expliquer l’hypothèse ergodique, il est 
commode d’avoir recours à un modèle très 
simple imaginé par H. Poincaré. Suppo- 
sons un liquide en mouvement stationnaire 
dans un récipient Q de forme invariable et 
complètement rempli. Si une molécule du 
liquide occupe la position (o 0 à l’instant 0 et 
Cl) / à l’instant t, on peut décrire le passage de 
l’instant 0 àl’instant t et, plus généralement, 
de l’instant S à l’instant s + t , au moyen 
d’une transformation ponctuelle 0, opérant 
dans Q, pour laquelle : 

= 9fG>o) 
et : 


0) J+f = 0 f (<■>,), 

et cela pour toutes les molécules de liquide. 
Il va de soi que ces transformations 
forment un groupe, c’est-à-dire que : 

( 1 ) 0 J+r = 0,0 0 ,, 

quels que soient s, t £ R ; ou bien, si l’on 
se désintéresse du passé, un semi-groupe 
en ne considérant la condition (1) que pour 
des valeurs positives ou milles s et t. Pour 
t = 0, 0q désigne la transformation iden- 
tique de Q. On peut envisager une simpli- 
fication supplémentaire en se limitant aux 
instants discrets .... 2, 1, 0, 1, 2, et, 
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en posant 0j = 0, se ramener à l’étude du 
groupe G à un générateur 0 : 

G = { 0" | h G Z } 
ou bien du semi-groupe : 

{0" |« GN}. 

En outre, l’incompressibilité du liquide 
amène à poser la condition suivante : Si E 
est un volume partiel de Q et si : 

0-‘E= {g)|0wGE}, 

alors les mesures de E et de 0 "*E sont 
égales ; autrement dit, la transformation 0 
conserve la mesure. Pour un point donné 
G) G Q, l’ensemble : 

{ 0” G) | « G Z (ou N)} 

est appelé trajectoire de tu. On dit qu’un 
point 0 est topologiquement infiniment 
récurrent si tout voisinage de ce point 

possède une infinité de points de sa tra- 
jectoire. On peut alors énoncer le théo- 

rème de récurrence qui peut être considéré 
comme le premier théorème ergodique et 
qui fut établi par H. Poincaré en 1890. 

Théorème de Poincaré. Presque tout 

point de Q est topologiquement infiniment 
récurrent. 

En vérité, cela n’est pas exactement 
l’énoncé donné par le célèbre géomètre qui 
ne pouvait pas faire usage à cette époque 
de la théorie de la mesure de Lebesgue, 
théorie qui permit quelques années plus 

tard de prouver le théorème de Poincaré. 

Revenant au problème général, consi- 
dérons un système mécanique S constitué 
par N particules. L’état de S à chaque 
instant est déterminé par la connaissance 
des 3 N coordonnées des particules et des 
3 N composantes de leurs vitesses. Ces 
états peuvent ainsi être représentés par des 
points 0 de l’espace R 6N appelé espace de 


phase. Il peut être aussi plus commode de 
substituer à ces 6 N coordonnées 6 N 
autres paramètres qu’on ne précisera pas 
ici. Le système S évolue sous l’action de 
forces extérieures et des actions mutuelles 
des particules, et cette évolution est régie 
par un système d’équations différentielles 
qui permet de déterminer à partir d’un état 
initial 0 O l’état to, du système à l’instant t. 
Si S est conservatif, les trajectoires des 
points 0 sont portées par des variétés 
plongées dans R 6N et chacune de celles-ci 
correspond à une valeur constante de 
l’énergie de S, ce qui explique l’emploi du 
terme ergodique. L’une quelconque de ces 
variétés sera pour nous le récipient Q du 
modèle de Poincaré. L’invariance de la 
mesure, lorsque les paramètres décrivant 
l’état de S sont convenablement choisis, est 
assurée par un résultat général dû à 
Liouville. Le physicien qui observe l’évo- 
lution du système s’intéresse à des mesures 
portant sur les valeurs de fonctions de 
l’état de S (observables). Soit / l’une 
d’elles, f : Q — ► R. Si l’on tient compte 
d’une part du grand nombre de particules 
et du fait que, dans un intervalle de temps 
très petit pris pour unité, se produit un 
nombre très élevé de microphénomènes 
(collision de particules, etc.), si l’on tient 
compte d’autre part de la durée qu’exige 
une mesure, on s’aperçoit que le physicien 
ne peut pas comparer ses mesures aux 
valeurs théoriques instantanées f(o) mais 
plutôt aux moyennes temporelles : 


( 2 ) 


n 


n — 1 

* = 0 


portant sur n instants consécutifs 0, 1, 2, . . . . 
fl 1 et cela pour de très grandes valeurs 
de n. Ensuite, en supposant même que 
l’état initial 0 soit parfaitement connu, la 
détermination des états successifs 00, 0 2 0, 
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..., 0'^ l (o exigerait l’intégration du système 
différentiel mentionné plus haut, calcul 
pratiquement impossible à effectuer. Il faut 
donc imaginer un autre moyen d’atteindre 
les quantités théoriques (2) et c’est là 
qu’intervient l’hypothèse ergodique. Cette 
hypothèse postule l’égalité des moyennes 
de phase : 



et des moyennes (2) pour ri assez grand, Q 
étant la variété associée aux données de 
l’expérience. 


0-invariante (c’est-à-dire f = f 0 d) et 
enfin : 

\fdm=\ fdm , 

quel que soit l’ensemble mesurable A 
invariant, c’est-à-dire tel que A = 0 _1 A. 

Dans le cas particulier où la condition 
(E) suivante est satisfaite : les seuls ensem- 
bles invariants sont modulo les ensembles 
négligeables, l’ensemble Q et l’ensemble 
vide, les fonctions invariantes sont les 
fonctions constantes presque partout 
(p.p.), et le théorème de Birkhoff donne 
l’égalité : 


2. Les théorèmes de G. D. Birkhoff 
et de J. von Neumann 

Qn va mamtenant formaliser le problème 
ergodique. On se donne un espace com- 
pact Q et une mesure de Radon positive m 
SUr Q (Cf . INTÉGRATION ET MESURE ; OU peut 
se placer dans des situations plus généra- 
les, mais on n’a pas jugé utile de le faire 
ici), qui est aussi une probabilité 
m(Q) = 1. On se donne aussi une trans- 
formation mesurable 0 : Û — ► Q et on 
suppose que 0 conserve la mesure, c’est- 
à-dire que 0 vérifie la condition : 

(3) W(0- 1 E)=m(E) 

pour tout ensemble mesurable E. Cette 
condition entraîne que 0 -1 E est négligea- 
ble si E est négligeable, c’est-à-dire 
m(E) = 0. 

Théorème de Birkhoff. Soit f une fonc- 
tion complexe et intégrable sur Q ; la suite 
des moyennes de Cesaro : 



converge presque partout sur Q vers une 
fonction intégrable /; cette fonction f est 


lim - f o 0^ = f fdm (p.p.) ; 

«— • « n / j Jq 

* = o 

autrement dit le système (Q, m, 0) vérifie 
l’hypothèse ergodique si la condition (E) 
est remplie. On dit dans ce cas que 0 est 
transitivement métrique ou encore que 0 est 
ergodique. 

Quelques semaines avant que 
G. D. Birkhoff eût donné son résultat, 
J. von Neumann avait établi le théorème 
suivant en faisant les mêmes hypothèses 
que pour le théorème de Birkhoff. 

Théorème de von Neumann. Soit f une 
fonction complexe sur Q, de carré inté- 
grable ; la suite des fonctions : 



k = o 


converge en moyenne quadratique vers 
une fonction f de carré intégrable et 
0-invariante ; autrement dit : 

n — 1 ^ 

lim f - ^ /o 0* — / dm = 0 


/-/o0 (p-p.f 
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Il n’est pas question de donner ici les 
démonstrations de ces théorèmes, mais il 
est utile d’ajouter quelques indications sur 
ces preuves pour montrer en particulier les 
liens existant entre la théorie ergodique et 
l’analyse fonctionnelle. 

Dans ces théorèmes intervient une 
transformation agissant non pas sur les 
points de Q mais plutôt sur les fonctions 
définies sur Q. Il s’agit de l’application : 

T/ = /o0. 

Pour éviter des difficultés techniques, 
on ne distinguera pas des fonctions égales 
presque partout ; et, d’ailleurs, l’hypothèse 
d’invariance de la mesure entraîne que, si 
f est négligeable, c’est-a-dire 

J l/l dm = 0, 

f 0 0 l’est aussi. 

Cela posé, soit L/ l’espace des fonctions 
complexes sur Q de puissances pièmes 
intégrables : 

| \f\ p dm < + », 

p étant un nombre réel donné 
1 ^ p < + oo. On sait que L 2 est muni 
d’une structure d’espace de Hilbert où le 
produit hermitien de deux éléments /j et / 2 
est défini par : 

<fufi > =[ f\hdm\ 

JO 

f-> est la conjuguée complexe de / 2 et la 
norme d’un élément / est : 

l [ f I 2= (</f» ,/2 - 

Alors il est facile de voir que T est un 
opérateur linéaire et unitaire sur L 2 . Cela 
étant, et sans entrer dans les détails, la 
démonstration du théorème de von Neu- 
mann repose sur le fait qu’il existe dans L 2 


deux sous-espaces fermés et orthogonaux 3 
et JC tels que tout f 6 L 2 s’écrive d’une 
seule manière : f = (j -j -h, avec g E 3 et 
h E JC, où 3 est le sous-espace des inva- 
riants (g E 3 <=> g = Tg) et JC est l’adhé- 
rence du sous-espace image de I -T. 

On ne dira rien de la preuve donnée par 
Birkhoff de son théorème, mais on don- 
nera une indication sur la démonstration 
proposée par Yosida et Kakutani. Elle est 
fondée sur le lemme suivant, nommé par 
ces auteurs « théorème ergodique maxi- 
mal ». 

Soit /E L 1 et E l’ensemble des G) pour 
lesquels l’une au moins des sommes : 

n 

* = 0 

est positive ; alors : 

J fdm ^ o. 

Illustrons ce qui précède par deux 
exemples. 

a) Q est le tore à une dimension, 
Q = R/Z. L’application 0 est définie par 
00) = G) -f- a où a est la classe d’équiva- 
lence d’un nombre irrationnel. La mesure 
J71 sur Q est induite par la mesure de 
Lebesgue sur R. On peut voir facilement 
ici que 0 conserve la mesure et que 0 est 
ergodique. On a ainsi : 

n — 1 

lim t ^/(o + *a) = dm (p. p-), 

quel que soit f G L 1 . Ce résultat avait été 
démontré directement par Khintchine sans 
utiliser le théorème de Birkhoff. 

b) Q est l’intervalle [0, 1] muni de la 
mesure de Lebesgue. Chaque réel 
0) E [0, 1] s’écrit dans le système décimal, 
au moins d’une manière, 0 = 0, Ct^Cl^ 
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où les a l sont des entiers compris entre 0 ou encore, en désignant par l A la fonction 
et 9. Posons alors : caractéristique de l’ensemble A, 


= 0, fl 2 fl 3 a 4 ...» 

en observant que, dans tous les cas, 0ù> est 
bien défini par la donnée de (0. Il est moins 
facile ici de vérifier que 0 conserve la mesure 
et que 0 est ergodique. Admettons-le et pre- 
nonsfégale à la fonction caractéristique de 
l’intervalle [qj 10, qj 10 + 1/10[, avec 
06(0,1,2,.... 8}. 

On a /(«) = 1. si a { — q ou si a ] = q — 
1 et a, = = = 9. Le théorème de 

Birkhoff affirme, dans ces conditions, que : 

Ce résultat, découvert par É. Borel, 
exprime que, pour presque tout réel x, 
chaque chiffre admet dans la suite des 
décimales du nombre x la même fréquence 
limite 1/10. 


3. Propriétés de mélange 

Revenons au modèle de Poincaré et sup- 
posons que le liquide enfermé dans le 
récipient Q soit, suivant une image de 
Halmos, un mélange de vermouth et de gin 
dans les proportions de 9/ 10 de gin et 1/ 10 
de vermouth. Le récipient Q est un shaker 
que l’on agite pour confectionner un 
cocktail. Chaque mouvement d’agitation 
du shaker s’effectue aux instants 1, 2, .... 

, , , Si B est la partie de Q occupée 
initialement par le vermouth, alors, pour 
toute autre partie mesurable A du shaker, 
le rapport entre la quantité de vermouth 
contenue dans A et la quantité totale de 
vermouth est, à l’instant n , 

m(0-" AH B) 

mi B) 


— L f 1 A (9” «)<*”(«). 

m (b; Jb 

La moyenne arithmétique de ces rap- 
ports pris aux instants 0, 1, .... n — 1 est 
donc : 


(4) 

k = 0 

On suppose toujours m(Q) = 1 . Si 0 est 
ergodique, la suite (4) converge vers m(A). 
Autrement dit, en moyenne, la suite : 

w(0-^nB) 

converge vers m(A). Cela est, bien 
entendu, réalisé a fortiori si : 


lim 

*-*°p 


m (0 — "A O B) 

mC b) 


= m (A), 


condition qui exprime qu’ après un temps 
assez long toute partie telle que A contient la 
même proportion de gin et de vermouth qui 
se trouvent ainsi parfaitement mélangés. 

On pose alors les définitions suivantes : 
- La transformation 0 est dite fortement 
mélangeante si, pour tout couple de parties 
mesurables A et B de Q, on a : 

lim m (0~ rt A PlB) = m (A)m (B), 

n-nx> 

La transformation 0 est dite faiblement 
mélangeante si, pour tout couple de parties 
mesurables A et B de Q, on a : 

n — 1 

lim IV | m (6“*A 0 B) — m (A)m (B) | = 0. 

k = Q 

Il est clair que toute transformation 
fortement mélangeante est, a fortiori, fai- 
blement mélangeante et que toute trans- 
formation faiblement mélangeante est, a 
fortiori, ergodique. 
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La condition de mélange faible est 
particulièrement intéressante du point de 
vue analytique. Reprenons l’opérateur T 
défini au chapitre 2. On peut définir le 
spectre de T (cf. théorie spectrale). 
Disons que T a un spectre continu si 1 est 
la seule valeur propre de T et de plus valeur 
propre simple. On peut alors prouver que 
0 est faiblement mélangeante si, et seule- 
ment si, T a un spectre continu. 


4. Systèmes dynamiques 

On ne donnera pas de définition générale 
et on se limitera aux systèmes (Q, m, 0) 
ayant les propriétés énoncées au début du 
paragraphe 2. On appelle un tel triplet 
cS = (Q, m, 0) un système dynamique. Soit 
cS = (O', m', 0') un autre système dynami- 
que. On dira que S’ est image hoinomor- 
phe de S s’il existe une injection mesurable 
(Ç> : Q — ► O' telle que cp o 0 = 0' o cp et m’ 
= cp(ra). Si q) est bijective et si chacun des 
systèmes S et S’ est image homomorphe de 
l’autre par cp et cp _I , S et S’ sont dits 
spatialement isomorphes. Cela étant, on 
peut poser la question suivante : Deux 
systèmes dynamiques donnés sont-ils iso- 
morphes ? Pour y répondre, il est bon de 
rechercher les invariants d’un système 
dynamique t S, c’est-i-dire les objets atta- 
chés à cS qui ne varient pas dans un 
isomorphisme spatial. Dans le chapitre 2, 
on a associé à la transformation 0 un 
opérateur unitaire T dans L 2 (w). Il est 
alors facile de vérifier que les valeurs 
propres de T sont des invariants de S. 

Un autre invariant fondamental des 
systèmes dynamiques est l’entropie ou 
invariant de Kolmogoroff-Sinaï qui peut se 
définir de la façon suivante : Désignons par 
X la fonction réelle continue et positive sur 
[0, 1], telle que /(x) = — X log x, pour 


0 < x ^ 1 ; à toute partition mesurable 
finie : 

Il = (O,) i < / < 

de Q, faisons correspondre le nombre 
H(II) défini par : 

K 

H(n> = ^ /{m (Q,)). 

fri 

On observe que, pour tout entier k, 

0“*n = ( e-*o i ) UU/I 

est une autre partition de Q et l’invariance 
de la mesure entraîne que : 

(5) H(0-*II) = H(II). 

La fonction x est concave et l’on en 
déduit, pour deux partitions P et P’, que : 

(6) H(n v in ^H(II) + H(IT), 

en notant 11 V IL la partition engendrée 
par II et IF. Les propriétés (5) et (6) 
permettent de prouver l’existence de la 
limite : 

ïï(ii) = Hm }h(ii v e->nv v e-*+>n), 

et aussi l’inégalité : 

H(n) ^ H(II). 

On pose alors : 

H = up H(II), 

la borne supérieure étant prise sur l’ensem- 
ble des partitions mesurables finies II de Q. 
Le nombre H (éventuellement + oo) est 
l’entropie du système S. Ajoutons que 
cette notion est très voisine de celle qui est 
utilisée par Boltzmann dans la théorie 
cinétique des gaz et qu’elle a été l’objet de 
profonds et difficiles travaux de Sinaï qui, 
par là. a fait un pas important vers la 
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solution du problème fondamental de la 
théorie ergodique (cf. chap. 1). 

Pour terminer, donnons un exemple. 
Soit A = {a„ . . . . a n ] un ensemble à ri 

éléments ; munissons-le de la topologie 
discrète et de la mesure de probabilité 
équirépartie : 

p ({a,}) = l/«, 

pour i = 1,2, n. Posons Q = A z ; cha- 
que élément de Q est une suite infinie dans 
les deux sens Q) = (..., (i)_j, to 0 , w i» • ••) 
d’éléments de A. Avec la topologie pro- 
duit, Q est un espace compact sur lequel 
agit la transformation 0 définie par 
( 00 ) )j = 0) /+ j, appelée shift-transformation. 
Si m désigne la probabilité produit sur Q, 
le triplet (Q, 777, 0) est un système dyna- 
mique qui joue un rôle important en 
théorie de l’information. Choisissons la 
partition : 

n = {Q 1 ,....Q„l 

où Q , = {g)| w 0 = Il est clair que 
777 (Q ■) = 1 jn et que H(II) = log 77. On 
peut alors prouver que l’entropie H de ce 
système dynamique est log n , ce qui 
montre en particulier que les systèmes 
obtenus pour des valeurs distinctes de n ne 
sont pas spatialement isomorphes. 


5. Théorie ergodique, 
probabilités et potentiels 

Les problèmes de convergence qui sont 
abordés au chapitre 2 concernent l’opéra- 
teur T : f t— ► Ty* = f o 0 agissant dans 
V(m) ou L 2 (m). Cet opérateur possède les 
propriétés qui suivent : 

a) T est linéaire ; 

b) T est positif : f ^ 0 => Jf ^ 0 ; 

c) T est une contraction, c’est-à-dire : 

Il T /||i s? Il/lli pour tout /€ L '(m). 


On peut aussi considérer de façon plus 
générale des endomorphismes de l’espace 
(réel) L [ (m) possédant les propriétés pré- 
cédentes et non nécessairement induits par 
des transformations ponctuelles 0. De tels 
opérateurs se présentent naturellement 
dans la théorie des processus marko viens. 
Ils sont définis à partir d’un noyau N : 
Q X # — * R + (Ji désignant la tribu des en- 
sembles mesurables de Q) où l’on suppose 
que l’application partielle G) •— * - N ((0, A) 
est mesurable pour A constant et que 
l’application A 1 — ► N(ci), A), O étant fixé, est 
une probabilité (ou une sous-probabilité) 
sur JL À tout L 1 on associe la mesure 
réelle p j sur (Q, Ji) par la formule : 

jn /(A) = J N(c»), A) f (u) dm (w), A £ Æ. 

Si l’on suppose que \\j est absolument 
continue par rapport à 777 , et cela quel que 
soit /’ la densité T/ = dydm est la trans- 
formée de f par T. La vérification des 
propriétés a , b et c est immédiate. 

Le théorème ergodique général, établi 
en 1960 par Chacon et Ornstein, pour une 
contraction positive T affirme que : Quelles 
que soient les fonctions intégrables / et g, 
g ^ 0, l’expression : 

Z 1 * 7 / i Tkg 

k = 0 1 k=Q 

tend presque partout vers une limite finie 
sur l’ensemble : 

T* g > 0 \ . 

* * = o J 

Chacon a, de plus, explicité cette limite. 
Cet important théorème, faisant suite à des 
travaux de Doob et de E. Hopf, a été aussi 
prouvé par J. Neveu par des méthodes 
probabilistes. 

Le lien avec la théorie du potentiel 
découle de recherches faites par A. Brunei. 
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par P. A. Meyer et par Ackoglu qui ont 
utilisé le lemme suivant, appelé lemme 
ergodique maximal . 

Soit fÇz L 1 (réel) et A E ^ tel que : 


AC 


lim sup 
n 



alors : 


J e K .fdm ^ 0, 

en désignant par e A le potentiel d’équilibre 
de A, relativement au noyau transposé T 
de T. 

L’opérateur 1 T qui agit dans se 
définit par dualité : Quels que soient /G L 1 
et g 

| Tf.gdm = jf.'Tgdm ; 

la fonction e A est, en gros, la plus petite 
fonction { T — sous-invariante (' Te, é A ) 
qui majore 1,. 

On a voulu montrer comment la théorie 
ergodique s’est développée et ramifiée à 
partir du problème fondamental posé par 
l’hypothèse ergodique. Il n’était pas pos- 
sible de résumer ici d’autres travaux diffi- 
ciles, par exemple ceux qui concernent les 
groupes ou les semi-groupes de transfor- 
mations ou d’opérateurs. 


ANTOINE BRUNEL 
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EXPONENTIELLE & 
LOGARITHME 


P our les constructeurs des premières 
tables, les logarithmes étaient avant 
tout un outil de calcul numérique ; mais 
leur importance n’a cessé de croître. De 
nos jours, les logarithmes et les exponen- 
tielles interviennent dans tous les domaines 
de l’activité humaine, qu’il s’agisse de 
physique, de médecine, de sciences humai- 
nes... C’est le cas de tout phénomène 
naturel dans lequel deux mesures x et y 
sont telles que le taux de variation Ay/Ax 
de y est proportionnel à y ; la quantité y 
dépend alors exponentiellement de x, car 
on a y’ = k}\ Mais les exponentielles 
s’introduisent aussi dans de nombreux 
autres cas ; c’est ainsi que les lois de 
Laplace-Gauss ou de Poisson sont des 
techniques de base de la statistique. 

En tant que fonctions nouvelles, les 
transcendantes élémentaires (logarithmes, 
exponentielles et fonctions trigonométri- 
ques) se sont introduites d’une façon 
naturelle au cours du XVII e siècle, à partir 
de considérations cinématiques tout 
d’abord (étude de la cycloïde par exemple). 
Avec les débuts du calcul infinitésimal, ces 
fonctions acquièrent une grande impor- 
tance théorique : découverte de leurs 
développements en série et rôle essentiel 
qu’elles jouent dans l’intégration de nom- 
breuses équations différentielles simples. 
Au XVIII e siècle, le mathématicien suisse 
L. Euler, par extension au champ com- 
plexe, a mis en évidence les liens étroits qui 
existent entre ces fonctions et a introduit 
les notations que l’on utilise encore 
aujourd’hui. 

Dans ce qui suit, on construit complè- 
tement ces fonctions à partir du logarithme 


népérien, primitive de 1/x, en se limitant à 
l’aspect théorique sans aborder l’aspect 
pratique des calculs. 


1. Résultats préliminaires 

Soit R le groupe additif des nombres 
réels ; les nombres réels strictement posi- 
tifs forment un groupe pour la multipli- 
cation que nous noterons RT. On se 
propose ici de décrire tous les homomor- 
phismes continus de ces groupes entre 
eux. Ainsi, les fonctions logarithmes, les 
fonctions exponentielles et les fonctions 
puissances sont des applications continues 

/rRj-R.^R-RÎ, /kRJ-R*, 

qui vérifient respectivement les relations 
fonctionnelles : 

f(xy) =/(■*) +/OX g(x + y) = g(x)g(y), 
h (xy) = h (x)h 0). 

Montrons pour commencer que les 
seuls homomorphismes continus du 
groupe additif R dans lui-même sont les 
homothéties. Soit donc : 

u : R — > R 

une application continue telle que 
u(x + y) = u(x) + u(y) ; posons u( 1 ) = 
a . Pour montrer que u(x) = ax pour tout 
nombre réel x, il suffit; à cause de la 
continuité, d’établir ce résultat pour x 
rationnel. Remarquons d’abord que la 
relation fonctionnelle entraîne : 

u(n) = k(1 + 1 + + 1) 
n fois 

= fl + fl+ + a = an, 

» 

n fois 
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pour tout entier positif n ; d’autre part, 
u( 1) = u( 1 + 0) = M(l) + u(O), d’où 
m( 0) = 0. Pour les entiers négatifs, on a : 
0 = u(0) = u(n H- (-n)) = u(n) + u( 
n ), d’où : 

u{— n) =-u(n) = a x (-n); 

ainsi, u(x ) — üX pour tout entier relatif. 
Soit enfin x = pjq un nombre rationnel ; 
on a : 

x + x + ... + x = qx = p, 

S. ! 

q fois 

d’où : 

u {qx) = gu{x)= u(p) = a xp, 
et finalement : 

«(x) = a X — = ax. 

4 

Pour a = 0, on obtient l’application 
nulle et, pour a ^ 0, ces homomorphismes 
sont des isomorphismes, c’est-à-dire qu’ils 
sont bijectifs. 

Il est facile de voir que la continuité de 
u équivaut à la continuité à l’origine, ou 
encore au fait que u soit bornée au 
voisinage de zéro. On peut même démon- 
trer que la mesurabilité de u suffit; 
en revanche, si l’on n’impose aucune 
condition, on peut montrer, en faissant 
appel à l’axiome du choix, qu’il existe des 
homomorphismes u autres que les homo- 
théties. 

Revenons aux équations fonctionnelles 
vérifiées par f et g. En intégrant ces 
équations, on voit que f et g sont, en fait, 
de classe C 1 . On peut donc dériver des 
équations par rapport à y ; ce qui donne : 

xf'{xy) -/'(*) 

et donc, pour y = 1, 

*/'(*) =/'(!); 


de même, on a : 

g'(x + y)=g’(y)g(x) 

et donc, pour y = 0, 

g'(*)= g'{0)g{x). 

En particulier, on voit que f ‘(x) = k/x, 
ce qui conduit à étudier les primitives de 
x ► 1 /x. C’est ainsi que l’on définira le 
logarithme au chapitre 2. La fonction 
exponentielle s’en déduit alors par passage 
à la fonction réciproque (chap. 3). Nous 
aurons besoin pour cela du théorème 
classique d’inversion. 

Inversion des fonctions monotones 

Dans ce qui suit, nous nous limite- 
rons, pour des facilités d’ énoncé, à des 
fonctions croissantes, étant entendu que 
les résultats correspondants pour les fonc- 
tions décroissantes s’en déduisent immé- 
diatement. 

Soit f une fonction à valeurs réelles 
définie et strictement croissante dans un 
intervalle I = (a, h) ; 1 est quelconque, 
borné ou pas (ce qui veut dire qu’on peut 
avoir a = — oo par exemple), ouvert, fermé 
ou semi-ouvert. Par des arguments très 
analogues à ceux qui sont exposés à la fin 
du chapitre 4 de l’article calcul 
infinitésimal - Calcul à une variable, on 
peut montrer que fix) tend vers une limite 
a (resp. p), éventuellement égale à — oc 
(resp. + oo), pour x tendant vers a par 
valeurs supérieures (resp. vers b par 
valeurs inférieures) : cette limite en a est la 
borne inférieure (ou — oo, si cet ensemble 
n’est pas borné inférieurement) de 
l’ensemble des nombres f(x), x G 1. 

Si f est de plus continue, on déduit 
fa^il^ment du théorème 14 bis du même 
article (chap. 9), dit théorème des valeurs 
intermédiaires, que f réalise une bijection 
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de 1 sur l’intervalle J = (a, (3), les extré- 
mités correspondantes de 1 et J étant de 
même nature, incluses ou exclues simulta- 
nément. De plus, la bijection réciproque de 
J sur 1 est, sous ces hypothèses, continue. 
Ainsi, on peut énoncer le résultat suivant : 
si f est une application continue stricte- 
ment croissante d’un intervalle I dans R, 
alors c’est une bijection de I sur l’intervalle 
image et la bijection réciproque est conti- 
nue. Si f est dérivable, l’application réci- 
proque est dérivable en tout point 
x = f(y) £= J tel que f (y) ^ 0 et on a : 


droites X = 1 et X = x (fig. 1) ; on a donc 
lnx < 0 pour 0 < x < 1 et ln x > 0 pour 
x > 1. On utilisera dans l’ouvrage la 
notation normalisée anglo-saxonne ln X 


On verra dans ce qui suit de nombreux 
exemples de cette situation. 


2. Logarithmes 
Définition 

Il n’existe pas de fonction rationnelle 
admettant pour dérivée 1 jx ; pourtant, 
cette fonction est définie et continue pour 
X > 0, et, par suite (Cf. calcul infinité- 
simal Calcul à une variable, chap. 5), elle 
admet des primitives dans cet intervalle. 
Ces primitives constituent donc de « nou- 
velles » fonctions dont nous allons étudier 
les propriétés. Elles diffèrent toutes entre 
elles d’une constante, et il suffit d’en 
examiner une. 

On appelle logurithme népérien ou natu- 
rel la primitive de \/x dans ]0, oo[ qui 
s’annule pour x = 1, soit : 

(1) L(x) = \nx=j X j, x >o; 

ainsi, c’est une fonction dérivable, de 
dérivée 1 /jc. Géométriquement, si x > 1, 
c’est la mesure de l’aire comprise entre 
l’hyperbole d’équation Y = l/Xet les deux 


Établissons dès maintenant la propriété 
fondamentale du logarithme népérien : 
c’est un homomorphisme (en fait, comme 
on le verra ci-dessous, un isomorphisme ) du 
groupe multiplicatif R* dans le groupe 
additif R. Soit y un nombre réel positif; la 
fonction f (x) = In xy a la même dérivée 
que la fonction ln X : 

f(x) = y. L'(xy) ~y— = -> 

7 xy x 

et, par suite, ces deux fonctions diffèrent 
d’une constante, soit : 

ln xy = lnx + k; 

faisant x = 1, on a k = ln y, d’où la 
relation fonctionnelle : 

(2) ln xy = i n x + lny. 

On en déduit immédiatement, pour tout 
entier n E Z, 

lnx" = n lnx ; 

plus généralement, avec la convention des 
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exposants fractionnaires ; si a = p/q, 
q > 0, rappelons que, par définition, 
X a = \^xP ; on a donc : 


tiquement négligeable devant x pour x 
tendant vers l’infini. En effet, pour t ^ 1, 
on a par exemple : 


(3) \nx a = ln Vxp = -lnx' 7 

q P 

= - ln x = a ln x. 

4 

D’autre part, si x et y sont des nombres 
positifs quelconques, on a y(x/y) = x, 
d’où : 


(4) 


ln - = ln x - 1 n y . 

y 


1 1 

vr 

d’où, pour x ^ 1, 

ainsi : ln x/x < 2/V / x, ce qui entraîne 
bien : 


(7) 


lim !^ = 0. 

x— X 


Comportement et graphe 

La fonction logarithme népérien est stric- 
tement croissante pour x > 0, car sa 
dérivée est strictement positive dans cet 
intervalle. 

Étudions le comportement du loga- 
rithme lorsque x tend vers l’infini. Pour 
tout entier n, on a : 

ln 2® — n ln 2 ; 

si A est un nombre positif, soit N un entier 
plus grand que A/( ln 2). Pour x > 2 N = B, 
on a : 

ln jc > ln 2 N >N ln 2 > A, 



ce qui montre que : 

(5) In x — ► + oo x — *■ oo. 

On en déduit facilement le comporte- 
ment de ln X pour x tendant vers 0 par 
valeurs positives ; si A est un réel positif, on 
a, pour le même choix de N que ci-dessus, 

ln* < -A, pour* < 1/2^; 

ainsi : 


Toutes ces propriétés permettent de 
tracer le graphe de L (fig. 2). On peut 
préciser le tracé en remarquant que la 
fonction est concave, car sa dérivée 
seconde — 1 /x 2 est négative ; la tangente au 
point d’abcisse 1 est de pente égale à 1, ce 
qui équivaut à : 


x — 0 x 


(6) lim lnx = — oo, 

x — 0 + 

Précisons le comportement de ln x en 
montrant que cette quantité est asympto- 


on exprime cela en disant que ln (1 + x) 
est équivalent à x pour x tendant vers 0 (cf. 
calculs ASYMPTOTIQUES). On peut préciser 
le comportement de ln (1 -h x) au voisi- 


340 



EXPONENTIELLE & LOGARITHME 


nage de x = 0 par le développement en = f(L [ (w)), en accord avec le diagramme 
série : suivant : 


(9) I n( 1 + x) = x — x 2 /2 + x 4 /3 — ... 

+ (- l)" + l x n /n + ... . 

valable pour x < 1, qui s’obtient en 
intégrant terme à terme la série géométri- 
que : 

1 —x + x 2 — x 3 + + (- l)»x" + . . . 

dont la somme est égale à la dérivée 
1/(1 H - de lîl ( 1 — |— x). 

C’est à partir de cette série que l’on peut 
calculer les valeurs numériques des loga- 
rithmes. En définitive, le logarithme népé- 
rien L : R* — > R est continu, strictement 
croissant et tend vers — x et H~ oo pour x 
tendant vers 0 (par valeurs supérieures) et 
vers + oo respectivement ; d’après le théo- 
rème d’inversion (cf. chap. 1) c’est donc 
une bijection, c’est-à-dire un isomorphisme 
(continu) du groupe multiplicatif des nom- 
bres réels positifs sur le groupe additif de 
tous les nombres réels. La bijection réci- 
proque est un isomorphisme du groupe R 
sur le groupe RT : c’est la fonction 
exponentielle que nous examinerons dans 
le chapitre suivant. En particulier, il existe 
un unique nombre réel positif dont le 
logarithme népérien est égal à 1 ; c’est le 
célèbre nombre e , dont la transcendance a 
été établie par C. Hermite en 1873. 

Autres logarithmes 

Proposons-nous maintenant de caractéri- 
ser tous les homomorphismes continus du 
groupe multiplicatif RT dans le groupe 
additif R. Soit f l’un d’entre eux ; tout 
nombre réel u s’écrit de manière unique : 

u — ln x, x > o , 

avec Y = L~ ] (u) ; l’application cp : R —►R, 
qui, à w G R, fait correspondre f(x) 


x 



<P 


est un homomorphisme continu du groupe 
additif R dans lui-même et est donc 
(cf. chap. 1) de la forme cp (u) = ku, OÙ u 
est une constante. Ainsi f(x) — ^ ln x, 
c’est-à-dire quef’est un multiple scalaire du 
logarithme népérien. 

Soitf — k L un tel logarithme ; il existe 
un unique nombre a > 0, défini par ln 
a ™ 1 jk, tel que/ (a) = 1. On dit que c’est 
la hase de la fonction logarithme / et on 
note : 


/(x) = log, x ; 


avec cette définition, le logarithme népé- 
rien est de base f. On a des formules de 
changement de base du type : 


( 10 ) 


log„x 


lnx 

\na 


Pour les calculs pratiques, on utilise des 
tables de logarithmes décimaux, de base 
a = 10 ; le passage d’un système à l’autre 
s’effectue au moyen des formules : 


log 10 x = M lnx, lnx = — log 10 x, 
M 


avec : M = 0,434 294 481 

ln 10 


et : 


- ~ 2,302 585 093. 


Historique 

L’idée qui est historiquement à la base de 
la notion de logarithme est la comparaison 
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de la suite des entiers et de la suite des 
puissances correspondantes d’un nombre 
a : 

1, 2,3, — n 

a, a 2 , a 3 ,. ..> a n , 

déjà étudiée par Archimède dans son traité 
de l’ Arénaire ; dans le Triparty en la science 
des nombres (1484) Nicolas Chuquet 
remarqua que, si on fait correspondre les 
termes de même rang, à la somme de deux 
nombres de la progression arithmétique 
correspond le produit des nombres de la 
progression géométrique. Cette correspon- 
dance fut étendue aux exposants négatifs et 
fractionnaires par Michael Stifel (1544), 
mais la notion de logarithme ne se déve- 
loppa vraiment qu’au début du XVII e siècle, 
lorsque l’Écossais John Napier, ou Neper 
(Mirifici logarithmorum cunonis descriptio , 
Édimbourg, 1614), puis le Suisse Joost 
Bürgi (Aritmetische uud geometrische Pro- 
gresstabulen, Prague, 1620) eurent l’idée 
d’introduire des nombres intercalaires en 
quantité suffisante et construisirent des 
tables permettant de passer d’une progres- 
sion à l’autre. Neper a rendu « continue » 
la correspondance entre les deux progres- 
sions en utilisant une image cinématique ; 
il les supposa engendrées l’une et l’autre 
par mouvement continu (« par fluxion ») : 
deux points mobiles se déplacent le long 
d’une droite à partir d’une même position 
initiale, l’un M avec une vitesse uniforme, 
l’autre N avec une vitesse proportionnelle 
à son abscisse ; le logarithme de l’abscisse 
de N est alors par définition l’abscisse de 
M. 

Les premières tables de logarithmes 
décimaux sont dues à Henry Briggs (Arith- 
metica logarithmica , 1624) qui fait des 
logarithmes un moyen de calcul numérique 
pratique. Les fonctions logarithme et expo- 
nentielle s’introduisent en analyse au cours 


du XVII e siècle et sont intimement liées à la 
création et au développement du calcul 
infinitésimal. 


3. Exponentielles réelles 

On va maintenant définir la fonction 
exponentielle comme fonction réciproque 
du logarithme népérien. 

La fonction exponentielle 

On appelle fonction exponentielle l’isomor- 
phisme E : R — ► R* ? réciproque du loga- 
rithme népérien ; ainsi, pour tout nombre 
réel x, E(x) = exp x est l’unique nombre 
réel > 0 dont le logarithme népérien est 
égal à x, soit : 

(11) y = expx <^x = \ny, y > 0 ; 

cela entraîne aussi, par composition de L 
et E que, pour tout x G R et pour tout 
y E Rî, on a: 

(12) exp (ln y) = y, ln (expx) = x. 

Puisque la fonction logarithme népé- 
rien est strictement croissante et dérivable 
de dérivée toujours non nulle, il en est de 
même de la fonction exponentielle ; son 
graphe est le symétrique du graphe de L 
par rapport à la première bissectrice 
d’équation y = x (fig. 3). 

La dérivée en x de la fonction expo- 
nentielle est l’inverse de la dérivée de la 
fonction logarithme népérien au point 
y — exp x s °it : 

(13) E’(x) = = y = E(X 1- 

Plus précisément, la fonction exponentielle 
est l’unique solution sur R du problème de 
Cauchy : 

(13') Y’ = y, y(0) = i ; 
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Soit enfin une dernière propriété de la 
fonction exponentielle. Pour tout entier n : 


expjt 


=( exp if)" ; 


puisque 


exp î = 1 + f +0 m 

n n \n } 


cela conduit à la formule : 


exp x = 



ce type de raisonnement (dû en subtance 
à Euler) demande, bien entendu, à être 
établi rigoureusement, par exemple par les 
développements limités. 


ainsi la fonction exponentielle est indéfi- 
niment dérivable et égale à toutes ses 
dérivées. La formule de Taylor en 0 s’écrit 
ici (cf. formule 47, CALCUL IN FINITES! MAL- 
Calcul à une variable) : 


EW 


1 A A A _ 

1 + ï! + 2! + + ^ +R »’ 


où : 


[R„| < exp | x | 


|jc|« + 1 
<» + 1) • * 


Le nombre e 

Pour x = 1, E( 1) = e, base des logarith- 
mes népériens. Ce nombre est la somme de 
la série : 

1 + 1 + 1 / 2 + 1 / 6 + ... + 1 /»! + ...; 

c’est aussi la limite de l’expression : 



qui, pour tout .v, tend vers 0 lorsque n tend 
vers l’infini. En effet, pour tout x , la suite 
Up = X?lp > vérifie u p+ Ju p = xj(p + 1), 
qui est inférieur à 1/2 en valeur absolue 
pour p assez grand, disons p ^ P; pour 
p ) P, on a donc 1 ^ (1/2 Y p , ce qui 
montre que la suite u p tend vers 0 pour p 
tendant vers +- oo. Ainsi, E(x) est, pour tout 
X G R, la somme de sa série de Taylor, soit : 


pour H tendant vers l’infini. 

Une valeur approchée de e , à 10 24 
près, est : 

2,718 281 828 459 045 235 360 287. 

Si n est un entier relatif, on a E(n) = e'\ 
puisque In ^ = fl ln e = n. Plus généra- 
lement, si x = p\q , q > 0, est un nombre 
rationnel, on a : 


( 14 ) exp jc = 1 + x + x 2 /2 ! + 

+ x n /n ! + ; 

Pour x oo, on déduit facilement de 
(7) le comportement asymptotique : 

(15) lim = 0, „ £ N. 


E(x) = \fëp — ep /( i = e x , 

avec la convention des exposants fraction- 
naires. Ainsi, la fonction exponentielle est 
un prolongement continu à R tout entier 
de l’application x^e x de Q dans RT 
définie par la convention des exposants 
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fractionnaires ; cela conduit à généraliser Par dérivation dans ( 17 ), on obtient 

cette notation en posant pur définition : facilement : 


E(x) = e x , 

pour tout réel x ; le fait que l’exponentielle 
est un homomorphisme de groupe s’écrit 
maintenant : 

(16) e x+ y = e x ey, 

formule valable pour x et y rccls quelcon- 
ques. 


Trigonométrie hyperbolique 

Introduisons maintenant les fonctions 
hyperboliques, qui jouent pour la géomé- 
trie du plan hyperbolique le même rôle que 
les fonctions circulaires pour le plan eucli- 
dien (cf. GROUPES ■ Groupes classiques et 
géométrie, chap. 3 ). 

Pour tout nombre réel A', on appelle 
cosinus hyperbolique de x, sinus hyperboli- 
que de x et tangente hyperbolique de x 
respectivement les nombres : 


( 17 ) 


r 


chx = i (e x + e~ x ) 
shx =^(e x — e~ x ) 


thx = 


shx 

chx 


e 2x — 1 . 
e 2x + 1 ’ 


remarquons que le cosinus hyperbo- 
lique est une fonction paire, tandis que 
les deux autres sont des fonctions im- 
paires. 

Un calcul simple montre que l’on a : 
ch 2 x — sh 2 x = 1 

pour tout x ; si a et b sont deux nombres 
réels la propriété ( 16 ) de la fonction 
exponentielle entraîne les formules d’addi- 
tion suivantes : 


ch (a + b) = ch a chb + sha shb, 
sh(a + b) = sha chb + ch a shb. 


(chx)’ = shx, (shx)’ = chx, 

(thx)‘ = 1— th 2 x = 1 . 

ch 2 x 

Puisque ch x ^ 1 , il en résulte que sh x 
est une application strictement croissante 
de R dans R et on voit que sh x tend vers 
— oo et + oo pour x tendant vers — oo et + x 
respectivement : cette fonction réalise donc 
une bijection de R sur R. Puisque sh 0 — 0 , 
le nombre sh x est du signe dex ; par suite la 
fonction paire ch x est strictement décrois- 
sante pour x ^ 0 et strictement croissante 
pour x ^ 0 ; d’autre part, ch x tend vers 
+ x, pour X tendant vers -j- oo ou vers — x. 
Enfin, la fonction th x, dont la dérivée est 
toujours > 0, est strictement croissante ; 
pour x tendant vers l’infini, on a : 

limthx =- 1 , limthx = + 1 , 

et, par suite, th x réalise une bijection de R 
sur l’intervalle ] — 1, — |— 1 [. 

On a représenté les graphes des fonc- 
tions hyperboliques sur la figure 4 . 

L’application t ^ (ch t, sh t) est une 
représentation paramétrique de la branche 
d’hyperbole X 2 — y 2 = 1 , x > 0 , d’où le 
nom de trigonométrie hyperbolique, par 
analogie avec la trigonométrie « circu- 
laire », La bijection réciproque s’appelle 
amplitude et se note u 1—1 * Am u. 

On désigne par Arg sh x la bijection de 

R sur R réciproque de sh x, par Arg ch X 

la bijection de ] 1 , x[ sur R + réciproque de 
la restriction de ch x à R4- et enfin par 
Arg th x la bijection de [ — 1 , — j— 1 [ sur R 
réciproque de th X. Ainsi : 

y = Arg shx, x E R £=>x = shy, 
y = Arg chx, x > \ <=^x — ch y y y > 0 ; 

y = Arg th x, — 1 < X < + 1 

«-X = thy , j;eR. 
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On obtient e ly — 2xe y — 1 = 0, en 
remplaçant sh y par son expression 
exponentielle dans x = sh y ; d’où 
e y = x + vx- -|- 1 , puisque €■ > 0. 
Ainsi, Arg shx s’exprime au moyen 
du logarithme népérien par la for- 
mule : 

Arg shx = ln(x + Vx 2 + 1) ; 

par des raisonnements analogues, on 
aurait : 


Arg chx = ln(x + y/x 2 — 1), 
, 1 1 4- x 

AlëÜlX =2 ln ~ X 


Les dérivées des fonctions hyperboli- 
ques inverses sont très simples et se calcu- 
lent en appliquant le théorème du chapitre 
1 sur la dérivée d’une fonction réciproque ; 
nous ne détaillerons pas le calcul, nous 
contentant d’indiquer le résultat : 

(Argchjc) '= 

(Argshx) '= V^TT’ 

(Argthx)' = y-t— 


Pour terminer ces quelques lignes sur la 
trigonométrie hyperbolique, donnons enfin 
les développements en série de ch x, sh x, 
qui se déduisent immédiatement de (14) et 
de (1 7), et de Arg th x, qui s’obtient par inté- 
gration à partir de la série géométrique : 


1 


1— x 2 
avec \x\ < 1 : 


= 1 + x 2 4* x 4 + . . . . 


X 2 X 4 

chx = 1 + — + J! h 


ER 


X 3 jç + 1 

shx = x + 3Î + + (2 -^— 1)-T-^ •"’* ’ 


Ar ë thx^x + j + J + ... + w — i+ 

— 1 <x < + 1. 


Fonction exponentielle de base a 
Soit a un nombre réel strictement positif. 
Pour x rationnel, on a lna Y = Y In a (avec 
la convention des exposants fraction- 
naires ; cf. supra, chap. 1) ; d’où, d’après 
( 12 ): 

(18) = 

Désirant étendre cette notation, nous 
prendrons l’expression (18) comme défi- 
nition de a x pour tout x réel ; la fonction E„ 
définie par E,(x) = a” s’appelle la fonction 
exponentielle de base a. 
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Pour a = 1, on a l v _ 1 pour tout 
nombre réel X. Pour a > 0, Q 1, faisons 
le lien avec le logarithme de base a ; le 
logarithme de base a réalise un isomor- 
phisme (strictement croissant si a > 1. 
strictement décroissant si a < 1) du 
groupe multiplicatif R* sur le groupe 
additif R ; l’isomorphisme réciproque fait 
correspondre à tout réel x l’unique nombre 
y > 0 tel que : 

X = log a J> ; 


puisque 


* = log a y 


Iny 

Inc 


d’où ln V — X lïl a ; on en déduit : 

y _ e x\n a — a x , 

ce qui montre que la fonction exponen- 
tielle de base a est la fonction réciproque 
du logarithme de base a. C’est donc un 
isomorphisme de groupes, d’où : 

(19) a° = i, a~ x -\/a x a x +y = a x ay. 


Les fonctions x a x sont les seuls 
homomorphismes continus du groupe 
additif R dans le groupe multipli- 
catif R*. 

De la définition (18) résulte aussi : 


{a x y = a x y , (ab) x = a x b x , 


pour a, b réels positifs et A', y réels 
quelconques. En effet, pour la première de 
ces formules par exemple, on a : 

{a x )y — es lna x = ey xlna = a x y 


La fonction exponentielle de base ci est 
strictement croissante pour a > 1 ; elle est 
strictement décroissante pour a < 1 ; sa 
dérivée s’obtient facilement sous la forme 
( 18) ; on a : 

( a*)' — (e xlna J = (ln a)e xlna = (ln à)a x . 


Fonctions puissances 

Soit u un nombre réel quelconque ; on 
appelle fonction puissance l’application P u 
de R* dans R? qui, à A' > 0, fait corres- 
pondre le nombre réel positif x u . Par 
définition, on a donc : 

P„(jc) - x u - e ulrix : 

de (19) résulte que l’on a, pour A > 0, 

y > o, 

P H (. xy ) = P u ( x)P u (y), 

c’est-a-dire que P w est un homomorphisme 
du groupe multiplicatif Rî dans lui-même ; 
il résulte de ce qui précède que c’est un 
isomorphisme pour U 7 ^ 0, l’isomor- 
phisme réciproque étant P, 1 = P ]/V Pour 
U > 0, P, est strictement croissant et se 
prolonge par continuité pour X = 0 en 
posant P„(s) = 0 ; pour u < 0, P M est 
strictement décroissant. Les fonctions 
x ► x u sont les seuls homomorphismes 
continus de Rî dans RT. Dans tous les cas, 
on a, pour X < 0, 

p'"(X) = U P" ! (x) = «X "- 1 ; 


sur la figure 5. on a représenté les graphes 
des fonctions puissances pour diverses 
valeurs de w. 

Indiquons que l’on peut montrer, par 
des majorations explicites que nous ne 
ferons pas ici, que le reste de la formule de 
Taylor de P w au voisinage de 1 tend vers 0, 
pour x assez voisin de 1 ; on obtient ainsi 
le développement en skie : 


(!+*)■-! +UX+ 

»(*-!)(» _2) ' 
3! 

a(u — — k + 1) v4 . 

+ k! 


valable pour „v < 1 , qui généralise au cas 
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d’un exposant réel quelconque la classique 
formule du binôme de Newton. 

Enfin, décrivons le comportement 
asymptotique des fonctions puissances 
pour u > 0, la fonction P„ tend vers l’infini 
« plus vite » que la fonction logarithme et 
« moins vite » que la fonction exponen- 
tielle, lorsque x tend vers l’infini, soit : 


L’exponentielle complexe 

La série : 


z z 2 

(22) 1+J + Y + 


6 



i 

n -0 


Z n 

~n\ 


est absolument convergente pour tout 
nombre complexe z, Pour z réel, la somme 
est e = . Pour z E C, nous noterons encore 
exp zou É'-'la somme de cette série. D’après 
la règle de multiplication des séries abso- 
lument convergentes, on a, pour a, b £ C, 


ou : 


. V 1 a n b m 

e ° e = Ln\Lm\=L c ’' 

n = 0 m — 0 «=0 

Z n a k b n ~ k 
k\(n — k)\ 

k = 0 

a * 6 „-* = + 

n'.^k !(«—*)! n! 


ainsi, on a l’importante formule d’addi- 
tion : 


(23) e a + b =e a e b , û,b6C 


(20) lim — = 0 (u E R, a > 1), 

x -*■» a X 

(21) Hm = 0 (u > 0), 

comme cela résulte facilement de (15). 

4. Extension du domaine complexe 
et trigonométrie 


Puisque 1 = <?° = e~ e~ z pour tout 
z G C, on a toujours e z ^ 0 et, ainsi, la 
formule d’addition exprime que Texponen- 
tielle complexe définit un homomorphisme 
du groupe additif C de tous les nombres 
complexes dans le groupe multiplicatif C* 
des nombres complexes non nuis. 

En outre, pour tout a £ C, on a : 

exp a = exp a. 


Nous commencerons par le cas de la fonc- 
tion exponentielle, le plus simple car le déve- 
loppement en série entière (14) converge 
encore pour tout .v complexe, et cela sug- 
gère d’étendre cette fonction au domaine 
complexe en la définissant , dans ce cas, 
comme somme de la série correspondante. 


Enfin, par dérivation terme à terme de 
la série correspondante, on voit que, pour 
tout nombre complexe a , la fonction de 
variable réelle 

<p a : t exp at 

satisfait à la relation (p a (t) — acç u (t). Plus 
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précisément cp a est l’unique solution sur R 
du problème de Cauchy : ÿ = a\\ 
>■( 0 ) = 1 . 

Fonctions circulaires 

Soit Z = x + iy un nombre complexe, on 
a : 

( 24 ) e x+ 'y = e x e i y : 

la fonction exponentielle e *— ► e x ayant été 
étudiée, nous allons examiner maintenant 
la fonction y i— ► e iy . 

Pour t réel, on appelle respecti- 
vement cosinus et sinus de t les parties 
réelle et imaginaire de e l \ soit, par défi- 
nition, 

(25) e iï = cos / + i sin t ; 

il en résulte immédiatement les « formules 
d’Euler » : 



ginaire, les formules d’addition de la tri- 
gonométrie : 


( 26 ) 


COS / = 


e 11 -j- e~ u 

2 ♦ 


sin/ 


q\î £ —ir 

~2i 


cos (/ + r’) = COS t cos /' — sin t sin t 
sin(f + t’) = sinr cosC + sinr' cos/. 


D’après ce qui précède, l’applica- 
tion (f 1 : / exp it est un homomorphisme 
du groupe additif R dans le groupe 
multiplicatif U des nombres complexes de 
module 1 (cf. nombres complexes) et 
Cp'(/) = L’étude de ce morphisme 

constitue ce qu’on appelle traditionnelle- 
ment la trigonométrie (fig. 6). 

La relation e ir = 1 signifie que : 

(27) cos 2 / + sin 2 / = 1, 

qui est la relation fondamentale de la 
trigonométrie. 

Par ailleurs, la propriété fonction- 
nelle : 

£ I {* + t ) — £ lt £ tt 

donne, en séparant parties réelle et ima- 


Remplaçant e lt et e~~ lî dans les formules 
d’Euler par leurs développements en série 
déduits de (22), on obtient les développe- 
ments en séries entières, valables pour tout 
nombre réel /, des fonctions trigonométri- 
ques : 

(28) cos/ = 1— ^ + jj — ... 

t 2n 

+ ( “ 1) " ÿnjl + ■ 

/3 

(29) sin t = t — — + 

t 2n + \ 

+ (2 n + 1) ! + * 

ainsi les fonctions sinus et cosinus sont 
indéfiniment dérivables. Par dérivation des 
formules d’ Euler, ou des développements 
en série qui précèdent, on a : 

(30) cos' = — sin, sin’ = cos. 
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Le nombre JT 
Pour î = 2, on a : 



puisque la fonction cosinus est continue et 
égale à 1 pour t — 0, il existe un plus petit 
nombre réel T > 0 tel que COS T = 0. Nous 
désignerons par la lettre grecque TT, nota- 
tion traditionnelle depuis Euler, le nombre 
TT = 2 T. Ce nombre TT, dont la transcen- 
dance a été établie par F.Lindemann en 
1882, est égal à la moitié de la longueur du 
cercle de rayon 1. Une valeur approchée à 
10 -20 près est : 

TT ~ 3,141 592 653 589 793 238 46 . 

Ainsi, par définition de TT, on a COS t > 0 
dans l’intervalle ]0, tt/ 2[, ce qui entraîne, 
d’après (30), que la fonction sinus est 
strictement croissante dans l’intervalle 
[0, 7T/2], Puisque sin 0 = 0, cette fonction 
est donc strictement positive dans l’inter- 
valle ]0, tt/ 2], ce qui entraîne toujours 
d’après (30), que le cosinus est strictement 
décroissant dans cet intervalle. On peut 
alors constituer, entre 0 et tt/ 2, le tableau de 
variation des fonctions circulaires. 

Pour t = tt/ 2, la relation (27) entraîne 
que le sinus est, en valeur absolue, égal à 
1 ; par suite puisque ce nombre est positif 
sin tt/ 2 = 1. Ainsi : 

(31) e in/2 = cos j + i sin ^ = i, 

d’où, en utilisant la formule d’addition, 

e lv - i 2 = — 1, e 2in = i 4 = 1. 


Pour tout nombre complexe z, on a 
donc : 

(32) e * + 2/r = e z e liw _ e z. 

ce qui montre que la fonction exponen- 
tielle complexe est périodique, de période 
imaginaire pure 2 ix ; en particulier, les 
fonctions circulaires sont périodiques de 
période 2 tt et il suffit de les étudier dans 
l’intervalle [0,2 TT] par exemple. Leur varia- 
tion dans cet intervalle se déduit immédia- 
tement de leur variation dans [0, tt/ 2] en 
utilisant les relations : 



qui ne font qu’exprimer que : 

e i{t + tt/2) — gitgit / 2 — i e it — — s j n j + i cos / 

On peut ainsi former le tableau de 
variation de ces fonctions et construire 
leurs graphes (fig. 7). 

On introduit aussi la fonction tangente, 
définie pour t = (2k + 1) 7r/2, kE:X 
par : 

sin / 

tan t = ; 

cosr 

elle est périodique de période TT, de dérivée 
1/COS 2 t = 1 + tan 2 / > 0, donc stricte- 
ment croissante dans l’intervalle ouvert 
]- tt/2, tt/ 2[ (fig. 8). 

Le tableau de variation ci-dessus mon- 
tre que, pour tout couple de nombres réels 
W, V tels que u 2 + v 2 — 1, il existe un 
nombre réel, et un seul, t dans l’intervalle 
] — TT, 7T] tel que : 

COS t —u, sin t = y. 

Par suite, l’application t^e 11 est un 
homomorphisme surjectif de R sur U dont 
le noyau est le sous-groupe 27fZ constitué 
des multiples entiers de 2 7 T ; autrement dit, 
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deux nombres réels ont les mêmes cosinus 
et sinus si et seulement s’ils diffèrent d’un 
multiple entier de 2ir . 

Fonctions circulaires réciproques 

Les fonctions circulaires n’étant pas 
monotones dans R tout entier, il ne 
sera possible de définir des fonctions 
réciproques que si l’on se restreint à 
des intervalles sur lesquels ces fonctions 
sont strictement monotones. On définit 
ainsi les fonctions Arc sinus, Arc cosinus 
et Arc tangente comme fonctions réci- 
proques de la restriction du sinus à 
[- 7r/2, 7r/2], de la restriction du cosinus à 
[0,7T] et enfin de la restriction de la 
tangente à ]— 7T/2, Tr/2[ respectivement. 
Ainsi, Arc sin est une bijection stricte- 
ment croissante de [- 1, -f- 1] sur [- tt/2, 
tt/ 2] et : 

y = Arc sin x <=> x — sin y 

*€[—!,+ Il >>€[ — tt/2, + tt/2]; 


Arc COS est une bijection strictement 
décroissante de [ 1, + 1] sur [0, 7r] et : 

y = Arc COS x <=> x = COS y 

[— 1, + 11 Y G [0, tt] ; 

Arc tan est une bijection strictement crois- 
sante de R sur ] tt/2, + 7t/ 2[ (cf. fig. 8) 

et : 

y = Arc tan x $=> x = tan y 
x G R y G ] — n/2 y r/ 2[. 

Le théorème des fonctions réciproques 
permet de calculer les dérivées de ces 
fonctions. On a : 

(Arc sin x)' = , , - 1 < x < + 1 , 

VI — x 2 

(Arc cos x y — / — i y - 1 < x < + 1 , 

VI — x 2 

1 

(Arc tan x ) = r • 

v 7 1 +x 2 

Ces fonctions sont d’usage constant en 
calcul intégral et permettent d’écrire le 


350 



EXPONENTIELLE & LOGARITHME 



que et la trigonométrie circulaire. Ces 
fonctions sont analytiques dans tout le 
plan, et on a des relations du type : 

ch z = cos iz, sin il = isht, 

valables en particulier pour z réel, qui 
permettent de déduire la trigonométrie 
hyperbolique de la trigonométrie circulaire 
et vice versa. 

Fonction argument principal 

On a vu que / ► e lt est une bijection de 

]— TT, tt] sur U, et ainsi t l— * (COS /, sin t) est 
une représentation paramétrique du cercle 
trigonométrique : mais la bijection réci- 
proque n’est pas continue au point — 1. 
En revanche, l’application cp : t ► e lt est 
un homéomorphisme de ]— tt, ir[ sur 
U — {— 1], la bijection réciproque ip étant 
définie par : 

i|)(«) = 2Arctan[j(^-j-^| > „ eu _{_i} ) 


nombre TT comme une intégrale définie, 
par exemple : 

n _ fi dx 

2 J 0 Vl-x 2 


Trigonométrie complexe 

Les fonctions hyperboliques et les fonc- 
tions circulaires s’étendent au domaine 
complexe de manière naturelle, soit en 
utilisant des développements en série, soit 
(ce qui revient au même, puisque e z est 
défini comme somme d’une série) au 
moyen des formules : 


ch z = 


e z + e~ z 

2 


e z_ e ~z 

shz = — — 


cosz = 


e a + e~ a 

“ ~2 


ç iz Q — iz 

sin Z - i 

2l 


qui mettent en évidence, par passage au 
domaine complexe, les liens étroits qui 
existent entre la trigonométrie hyperboli- 


le nombre (1 //)((« — 1 )j(u + 1)) étant réel. 
En effet, pour tout nombre réel t de 
l’intervalle ]— TT, ît[, on a : 

t:m L sin(f/2) Ie“ — i 

2 cos(r/2) / e" + i 

Tout nombre complexe z 0 peut 
s’écrire de manière unique sous la forme : 

z=\z\e i ', t e] 3T. JT] ; 

rappelons que t s’appelle Y argument prin- 
cipal, noté Arg z, du nombre complexe 
z 0. D’après ce qui précède, l’applica- 
tion : 


z ^ Argz 

est continue sur C R , complémentaire 
dans C de l’ensemble des nombres réels 
négatifs, aussi appelé plan fendu ; on 
appelle cette applicationfonction argument 
principal. 
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En outre, si Xq est un nombre réel 
strictement négatif, on a : 

lim Arg z = — ir, lim Arg z = -j- TT, 

^“**0 0 
Imz >0 Imr < Q 

ce qui montre que la fonction argument 
principal ne se prolonge pas en une fonc- 
tion continue sur C — {O}. 

Mentionnons enfin l’important théo- 
rème suivant : 

Théorème de relèvement . Soit f une appli- 
cation de classe O 7 , p ^ 0, d’un intervalle 
I de R et à valeurs dans U. Alors, il existe 
une application cp, de classe C p , de 1 dans 
R telle que, pour tout t, 

En outre, deux fonctions continues 
satisfaisant à cette relation diffèrent d’une 
constante de la forme 2À"JT, & G Z. 

logarithmes complexes 

Les tentatives pour étendre les logarithmes 
aux nombres négatifs, puis aux nombres 
complexes, sont à l’origine d’une contro- 
verse célèbre qui a opposé, pendant près 
d’un demi-siècle, les plus grands esprits 
mathématiques du XVIII e siècle. Jean Ber- 
noulli admettait implicitement l’existence 
des logarithmes des nombres complexes, 
par analogie avec le cas réel, et il les 
introduisait tout naturellement à propos de 
l’intégration des fractions rationnelles, 
comme primitives d’éléments simples de la 
forme l/(r — a), a G C. Bernoulli soute- 
nait que : 

In (- l) = O, 

car son double ln 1 = ln (— l) 2 est nul ; il 
en résultait que ln x = ln (-x) pour tout 
réel positif, puis que In (— 1) = 0 puisque 
(— l) 2 = 1. Mais ces résultats étaient en 


contradiction avec d’autres formules obte- 
nues par J. Bernoulli lui-même. 

Leibniz, pour sa part, soutenait que les 
logarithmes des nombres négatifs ne peu- 
vent être réels. Une mémorable correspon- 
dance s’ensuivit entre les deux mathéma- 
ticiens, de 1700 à 1716. 

Dès 1728, L. Euler eut le pressentiment 
qu’il fallait abandonner l’unicité de la 
détermination si on voulait développer une 
théorie non contradictoire des logarithmes 
des nombres imaginaires. Dans un remar- 
quable mémoire de 1749, il expose une 
théorie complète, en montrant que tout 
nombre non nul a une infinité de logarith- 
mes possibles. Pourtant cela ne convain- 
quit pas d’Alembert, qui continua la polé- 
mique. 

Par analogie avec le cas réel, on est 
donc conduit à se demander si on peut 
définir le « logarithme » d’un nombre 
complexe Ç ^ 0, c’est-a-dire à chercher un 
nombre complexe z tel que e z = Ç. Remar- 
quons tout de suite que, s’il existe un tel 
nombre complexe Zq, alors la périodicité 
de la fonction exponentielle dans le 
domaine complexe, formule (32), entraîne 
que tout nombre complexe de la forme : 

z 0 + 2 kjri y kE Z, 

est aussi un « logarithme » de Ç. Ainsi, si 
on veut avoir une théorie des logarithmes 
dans le domaine complexe, il sera indis- 
pensable d’associer à tout nombre une 
infinité de logarithmes. 

Pour étudier la fonction exponentielle, 
nous nous limiterons d’abord, vu sa pério- 
dicité, à une « bande » du plan complexe 
dans laquelle la partie imaginaire de z varie 
dans un intervalle semi ouvert de longueur 
2 TT ; nous prendrons ici la bande B formée 
des nombres complexes z — x iy tels 
que — TT < y ^ + TT. 
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La relation : 

z = x + iy <E B, e z = C, 

équivaut aux relations : 

CEC*, x = ln|C|e t y = ArgC- 

L’unique solution dans B de l’équation 
e z = C s’appelle logarithme principal de Ç 
et se note ln C- Ainsi, par définition, pour 

C G C* 

ln C = ln|C| + i Arg C- 

Toutes les autres solutions de l’équation 
e~ = C sont alors de la forme : 

1 gC = ln C + 2kiri y k<EZ; 

la formule d’addition ne s’applique pas 
toujours à la détermination principale du 
logarithme mais peut s’énoncer ici : si lg £ 
et lg C' son t des logarithmes de C et C 
respectivement, alors lg C -j- lg £' est un 
logarithme de CC - 

La fonction C 1—1 " ln C est continue sur 
le plan fendu C — R ; on l’appelle déter- 
mination principale du logurithrne. C’est 
une fonction analytique (cf. FONCTIONS 
ANALYTIQUES ■ Fonctions d’une variable 
complexe, chap. 4). 


5. Développements eulériens 
des fonctions transcendantes 
élémentaires 

Dans son Introductio in analysis infinito- 
rum (1748), L. Euler définit l’exponentielle 
complexe par la formule : 

= lim( 1 +-Y; 

par suite, il considère la fonction exponen- 
tielle et les fonctions trigonométriques qui 


s’en déduisent comme des « polynômes de 
degré infini », 

En particulier : 



écrivant le polynôme du second membre 
comme un produit de facteurs du second 
degré et faisant tendre n vers l’infini, il 
obtient la relation : 



qui est le développement de sin z en 
produit infini (produit eulérien). 

Cette formule, valable pour tout z G C, 
met en évidence les zéros de la fonction 
sinus, tout comme la décomposition d’un 
polynôme comme produit de facteurs du 
premier degré (théorème de d’Alembert- 
Gauss, cf. nombres COMPLEXES , chap. 2). 

Par des procédés analogues, il obtient 
les développements : 


oc 



n ~ 1 


valables pour z ^ lai, k G Z. 

Cette fois, les fonctions de gauche dans 
les formules apparaissent comme des 
« fractions rationnelles de degré infini » ; 
au second membre figure alors la somme 
des parties principales, en chacun de leurs 
pôles, de ces fonctions (généralisation de la 
décomposition d’une fraction rationnelle 
en éléments simples). 

La théorie des fonctions analytiques 
fournit un cadre théorique permettant de 
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généraliser de telles formules (décomposi- 
tions de Weierstrass et de Mittag-Leffler ; 

cf. FONCTIONS ANALYTIQUES -Fonctions 

d’une variable complexe, chap. 8). 

JEAN-LUC VERLEY 
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1 1 est rare qu’un théorème de mathéma- 
tiques fasse la une des journaux inter- 
nationaux. C’est pourtant ce qui est arrivé 
en juin 1993 quand un mathématicien 


britannique travaillant à l’université de 
Princeton, Andrew Wiles, a annoncé lors 
d’un colloque la preuve de la conjecture de 
Taniyama-Weil, formulée dans les années 
1960 et dont on sait, depuis 1986, qu’une 
conséquence est le théorème de Fermât. 
C’est la connexion avec ce dernier, bien 
sûr, qui a fait naître l’émotion. Qu’a-t-il 
donc pour mériter une telle célébrité ? Un 
énoncé simple, une naissance quelque peu 
mystérieuse, une longue vie (près de trois 
cent cinquante ans) étroitement liée aux 
noms les plus célèbres des mathématiques 
occidentales. Et en apothéose, des avan- 
cées importantes qui soulignent les triom- 
phes des mathématiques professionnelles 
du XX e siècle. 

L'énoncé 

Un énoncé simple, donc, tout d’abord. Si 
on multiplie un nombre par lui-même, on 
obtient ce qu’on appelle un carré. Si on le 
multiplie encore une fois par lui-même, on 
obtient un cube ; encore une fois, une 
puissance quatrième, etc. Il existe des 
carrés qui sont la somme de deux autres 
carrés : par exemple 2.5 = 5 X 5 est la 
somme de 16 (— 4 X 4) et de 

9 (= 3 X 3). Il y en a beaucoup d’autres 

(en fait une infinité), comme 

4 225 (= 65 X 65) est égal à 

1 089 (= 33 X 33) + 3 136 (= 56 X 56) ; 
à cause du fameux théorème de Pythagore, 
cela revient à dire qu’il existe des triangles 
rectangles avec des côtés entiers. Les 
choses se gâtent (ou deviennent plus inté- 
ressantes) dès qu’on passe des carrés aux 
cubes ou aux puissances supérieures. Il 
n’existe pas de cube somme de deux cubes, 
ni plus généralement de puissance d’expo- 
sant supérieur à 2, somme de deux puis- 


354 




FERMAT GRAND THÉORÈME DE 


sances de même exposant : autrement dit, 
l’équation a n -f- b n - c" n’a pas de 
solutions a, b , c en entiers non nuis dès que 
n est au moins égal à 3. 

C’est cet énoncé d’apparence banale 
qu’un certain Pierre de Fermât, magistrat 
à Toulouse au XVII e siècle, nota en marge 
d’un de ses livres de mathématiques. [1 
ajouta à l’énoncé, et la légende s’en est 
abondamment nourrie, que la marge était 
trop étroite pour contenir la merveilleuse 
démonstration qu’il en avait trouvée. 

Pour les historiens modernes, il n’y a 
pas tant de quoi s’étonner. Fermât faisait 
partie de cette nouvelle classe intéressée 
par la science, et tout spécialement les 
mathématiques, qui prit un essor particu- 
lier au XVII e siècle. Courtisans parfois, gens 
d’ Église et plus souvent encore de robe, 
soldats occasionnels comme le fut Descar- 
tes, ils voyageaient, s’écrivaient beaucoup, 
s’informaient à travers toute l’Europe des 
derniers livres scientifiques disponibles, 
des instruments curieux, des observations 
astronomiques ou physiques et échan- 
geaient des problèmes de toutes sortes. 
Fermât demanda à plusieurs de ses cor- 
respondants de prouver qu’un cube ne 
peut être somme de deux cubes ou une 
puissance quatrième somme de deux puis- 
sances quatrièmes. Il n’obtint jamais de 
réponse satisfaisante : même pour ces cas 
les plus simples, la preuve est difficile. Elle 
requiert un minimum de connaissances 
algébriques — qui restaient alors en Occi- 
dent l’apanage d’un petit nombre, même 
parmi les amateurs de mathématiques — 
mais aussi une fine compréhension des 
problèmes spécifiques posés par les nom- 
bres entiers, que l’algèbre, s’appliquant à 
tous les nombres sans distinction, ne suffit 
pas à prendre en compte. Ce déploiement 
d’ingéniosité sur un tel énoncé parut à 


beaucoup des meilleurs mathématiciens de 
l’époque une perte de temps. 

Quoi qu’il en soit, Fermât ne parla 
jamais du cas général de son « théorème » 
dans ses lettres ; une étude serrée des dates 
de ses recherches et de leur contenu 
indique qu’il comprit sans doute que sa 
démonstration n’était pas valide pour tou- 
tes les puissances. Fermât esquissa seule- 
ment dans une autre note une preuve pour 
l’exposant 4, et c’est par de maigres 
documents, des extraits de lettres, les 
fameuses notes, publiés par le fils du 
mathématicien après la mort de Fermât, 
que ses successeurs eurent accès à ses 
recherches. Au début du XIX e siècle, la 
plupart des énoncés de Fermât étaient soit 
munis de preuves, soit infirmés. A une 
exception près, celle qu’on sait. Il y avait 
déjà eu pourtant des tentatives, dont cer- 
taines dues à d’importants mathémati- 
ciens : Euler, Legendre, Dirichlet, Lamé 
avaient ainsi élucidé les cas des premiers 
exposants (n = 3, 5, 7) ; il suffit en effet de 
prouver le théorème pour 4 et pour les 
exposants premiers, c’est-à-dire non divi- 
sibles par un autre entier supérieur à 1, 
puisqu’il est alors vérifié automatiquement 
pour tous les multiples), chacun deman- 
dant un redoublement de persévérance et 
d’astuce. 

Les premiers résultats généraux 
Un changement important pour les mathé- 
matiques prit place dans le courant du 
XIX e siècle : dans les universités ou, en 
France, dans l’aire d’influence de l’École 
polytechnique apparurent des mathémati- 
ciens professionnels, chercheurs et ensei- 
gnants, de plus en plus spécialisés. Les 
effets furent rapides : vers 1850, Ernst 
Eduard Kummer, professeur à l’université 
de Breslau (avant de devenir une des 
grandes personnalités de l’université de 
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Berlin) démontra que le théorème de 
Fermât est vrai pour tous les exposants 
premiers inférieurs à 100 (sauf trois pos- 
sibles exceptions qui échappaient à sa 
méthode). Pour Kummer même, le théo- 
rème de Fermât n’était déjà plus qu’une 
curiosité ; son principal mérite était de 
montrer l’efficacité des nouveaux outils 
mis au point dans des perspectives bien 
plus vastes. Kummer et ses successeurs, 
Richard Julius Dedekind, Léopold Kro- 
necker, notamment, cherchèrent à étendre 
les propriétés de l’arithmétique usuelle à 
d’autres familles de nombres et à généra- 
liser les notions de divisibilité, de décom- 
position en facteurs premiers, et bien 
d’autres. À long terme, ce sont des notions 
fondamentales de l’algèbre structurale et 
de la théorie des nombres modernes qui 
étaient ici en gestation. 

Kummer reçut pourtant un prix de 
l’Académie des sciences de Paris pour ses 
résultats sur l’équation de Fermât. Et ce 
n’est pas le moindre paradoxe de cette 
histoire : alors que les mathématiciens 
développent peu à peu des techniques 
complexes, posent et résolvent de nou- 
veaux problèmes, plusieurs prix (à Paris, à 
Gottingen) sont proposés pour la résolu- 
tion de cette énigme anodine déjà vieille de 
plus de deux siècles. Au cours du XX e siècle, 
un fossé grandissant va se creuser : des 
amateurs nombreux informés de l’exis- 
tence du problème (et des prix associés) 
par les livres de popularisation, ignorant 
souvent tout des travaux mathématiques et 
historiques pertinents, partirent en quête 
de la preuve (élémentaire) qu’aurait pu 
trouver Fermât. Tandis que les mathéma- 
ticiens travaillaient sur d’autres sujets, 
quitte à essayer au passage, lorsqu’elles 
pouvaient être pertinentes, leurs nouvelles 
approches : l’équation de Fermât faisait 
partie du folklore. Des raffinements théo- 


riques du travail de Kummer et la puis- 
sance accrue des moyens de calcul sur 
ordinateur permettaient, il y a une dizaine 
d’années, de prouver le théorème de 
Fermât pour quelques centaines de milliers 
d’exposants premiers. Mais on avait 
aussi appris à connaître ses limites théo- 
riques. 

L’approche de Wiles 

La dernière décennie a vu naître de nou- 
veaux espoirs, le théorème de Fermât 
ayant été intégré dans plusieurs théories en 
plein développement. En améliorant des 
estimations analytiques très fines, Etienne 
Fouvry prouva en 1985 l’existence d’une 
infinité d’exposants premiers p pour les- 
quels l’équation de Fermât a p + bP = (f 
n’a pas de solutions, sauf peut-être si p 
divise le produit abc : c’était un des 
premiers résultats portant sur une famille 
infinie d’exposants premiers. D’autres 
approches bénéficièrent des avancées 
importantes des années 1960 en géométrie 
algébrique grâce aux travaux d’Alexandre 
Grothendieck, Jean-Pierre Serre, Pierre 
Deligne, John Tate et bien d’autres : cette 
géométrie réussit en particulier, au prix de 
grandes difficultés techniques, à garder 
trace du type de nombres (entiers, frac- 
tions, nombres réels, complexes, etc.) avec 
lesquels on travaille. Nous n’évoquerons 
ici que deux lignes de recherche, la seconde 
étant celle suivie par Andrew Wiles. 

La première consiste simplement à 
interpréter l’équation a n -j- b fl = C J1 comme 
celle d’une courbe plane X 11 + y " = 1 (en 
posant x = a/c , V = bjc et en choisissant 
X et y comme coordonnées du plan). Le 
théorème de Fermât revient à montrer que 
cette courbe n’a aucun point dont les 
coordonnées soient entières ou fraction- 
naires (non nulles). En 1983, Gerd Faltings 
a démontré qu’une courbe de genre supé- 
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rieur ou égal à 2 n’a qu’un nombre fini de 
points à coordonnées fractionnaires (le 
genre est un invariant de la courbe lié au 
degré et aux singularités ; pour 
X? + y n = 1 , le genre est (n - 1 )(n - 2) / 2, 
donc supérieur ou égal à 2 dès que n est 
supérieur à 3). Le résultat de Faltings 
impliquait donc que le théorème de Fer- 
mât n’avait au plus qu’un nombre fini de 
solutions non milles (à un facteur commun 
près) pour chaque exposant. La démons- 
tration complète aurait été que ce nombre 
fini fût nul. Mais on n’en connaît pas de 
version effective, c’est-à-dire permettant de 
déterminer une borne pour les solutions 
éventuelles et, donc, de les rechercher 
systématiquement. Les essais pour rendre 
le résultat de Faltings effectif ont occupé 
beaucoup de spécialistes ces dix dernières 
années, et de nombreuses généralisations 
importantes de son théorème ont été 
découvertes au passage. 

Une autre approche a conduit aux 
travaux d’Andrew Wiles. Elle consiste à 
relier l’étude de l’équation de Fermât, 
a n -F b n = (f 1 , à celle de l’équation 
(*) y 2 = x(x a n ) (x + b n ). Celle-ci définit 
aussi une courbe plane (avec les coordon- 
nées X et y) : mais, cette fois, une éventuelle 
solution à l’équation de Fermât détermi- 
nerait les coefficients de l’équation de la 
courbe et non un de ses points. Si a, b, c 
ne sont pas nuis, la courbe est de genre 1 
et est un exemple de ce qu’on appelle une 
courbe elliptique. L’équation (*) en liaison 
avec le théorème de Fermât a été étudiée 
par Yves Hellegouarch dans les années 
1970, mais c’est seulement au milieu des 
années 1980 qu’elle est revenue sur le 
devant de la scène lorsque Ken Ribet, 
motivé par une idée de Gerhard Frey et 
d’importants travaux de Serre, prouva que 
la courbe (*), si a, 6, c ne sont pas nuis, 
contredirait une conjecture centrale des 


mathématiques, la conjecture de 
Taniyama-Weil. Autrement dit, si la 
conjecture de Taniyama-Weil était vraie, la 
courbe (*) ne pouvait exister, donc il ne 
pouvait y avoir de solutions non nulles à 
l’équation de Fermât. Cette relation contri- 
bua à renforcer la crédibilité du « théo- 
rème » de Fermât auprès des mathémati- 
ciens, car la conjecture de Taniyama-Weil, 
reliée à de nombreux autres phénomènes, 
semblait très convaincante. Comme l’a 
déclaré Andrew Wiles dans le journal de 
l’université de Princeton, « cela faisait du 
“théorème” de Fermât une conséquence 
d’un problème que les mathématiques ne 
pouvaient ignorer. Toute une architecture 
en dépendait ». C’est donc la preuve de 
cette conjecture (au moins la preuve d’une 
partie importante qui suffit pour l’applica- 
tion au théorème de Fermât) qu’a démon- 
trée Wiles. 

La conjecture de Taniyama-Weil, for- 
mulée dans les années 1960, prédit l’exis- 
tence d’un dictionnaire précis entre les 
courbes elliptiques dont l’équation a des 
coefficients entiers ou fractionnaires et des 
fonctions périodiques spéciales diction- 
naire proche de celui qui existe entre le 
cercle et les fonctions cosinus et sinus. 
Pour l’établir, Wiles met en œuvre des 
techniques variées des mathématiques 
actuelles (représentations galoisiennes. 
géométrie, cohomologie des courbes 
modulaires, systèmes cT Euler) et fait appel 
à des dizaines d’articles écrits par des 
chercheurs de nombreux pays dans les 
quinze dernières années. 

Cette multiplicité des outils utilisés est 
en partie responsable de la durée et de la 
complexité des vérifications qui ont été 
nécessaires. À la fin de 1993, on ignorait 
si toutes les étapes de la preuve proposée 
pouvaient être confirmées, En octobre 
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1994, Wiles et Taylor produisaient une 
démonstration complète. 

Quel est le rapport entre cette réalité du 
travail mathématique contemporain, 
d’une haute technicité, nécessitant l’inter- 
vention d’une communauté internationale 
dont seuls quelques noms ont pu être 
mentionnés ici, et l’effervescence qu’a 
suscitée le théorème de Fermât ? La 
réponse n’est pas simple. On pourrait 
se réjouir que l’énoncé de Fermât soit 
devenu un mythe et qu’il fournisse l’occa- 
sion de s’intéresser aux mathématiques 
d’aujourd’hui. Ou déplorer que les mathé- 
matiques soient tellement coupées de la 
culture ordinaire que seule la légende leur 
offre une voie d’accès. La réalité, y com- 
pris celle de la théorie des nombres 
contemporaine, liée de multiples façons 
non seulement à la géométrie mais aussi à 
la physique par exemple, n’est-elle pas plus 
riche et plus intéressante que la fable 
superficielle d’un génie isolé gardant jus- 
que dans sa tombe le secret élémentaire 
d’un petit énoncé ? Les remarquables 
recherches de Fermât lui-même méritent 
d’être mieux appréciées. A fortiori celles 
qui ont suivi. Si mathématiques et culture 
s’accordaient, pour changer ? 

CATHERINE GOLDSTEIN 
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L e terme de fonction a été introduit par 
Leibniz (1692) dans un contexte géo- 
métrique : il s’agit pour lui de portions de 
lignes droites qui dépendent d’un point 
variable sur une courbe, comme la tan- 
gente ou la normale. Jean Bernoulli, en 
1698, a repris ce terme pour désigner une 
quantité X « composée d’une manière 
quelconque de X et de quantités données », 
OÙ A' désigne en l’occurrence l’ordonnée du 
point variable sur la courbe ; plus tard 
( 1718 ), il proposera de noter fx une 
fonction d’une quantité variable X (pas 
forcément rattachée à un contexte géomé- 
trique). Le concept de fonction ainsi 
dégagé a servi de base à Euler pour son 
exposé de l’analyse mathématique (1748) 
d’un point de vue formel et non plus 
géométrique. Euler définit une variable 
comme une quantité qui admet toutes les 
valeurs possibles, par opposition à une 
constante, dont la valeur est fixée, et il 
représente géométriquement une variable 
par un axe ; ensuite, il définit une fonction 
d’une variable comme « une expression 
analytique composée d’une manière quel- 
conque de cette quantité variable et de 
nombres ou de quantités constants ». Bien 
entendu, il ne précise pas ce qu’il entend 
par « expression analytique », ni la façon 
dont elle doit être « composée » : la suite 
du livre montre que c’est au moyen des 
opérations algébriques élémentaires éven- 
tuellement itérées indéfiniment (séries, 
produits infinis) et des opérations trans- 
cendantes comme log, exp, sin, COS ; sui- 
vant la manière dont elles sont composées, 
Euler classe les fonctions en algébriques et 
transcendantes, les fonctions algébriques 
étant elles-mêmes subdivisées en rationnel- 
les et irrationnelles. 
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Les fonctions sont représentées graphi- 
quement par des courbes dans le plan, où 
l’ordonnée est la valeur de la fonction 
lorsque l’abscisse est la valeur de la varia- 
ble ; inversement, Euler se demande si une 
courbe donnée correspond à une fonction, 
et il est amené à distinguer les courbes 
« continues », graphes de fonctions défi- 
nies par des expressions analytiques, et les 
courbes « discontinues » (ou « mixtes » ou 
« irrégulières »), réunion de morceaux qui 
correspondent à diverses fonctions. Par la 
suite, Euler sera amené à étendre le 
concept de fonction, en remarquant que 
les « fonctions arbitraires » intervenant 
dans la solution de l’équation des cordes 
vibrantes donnée par d’Alembert (1747) 
n’étaient pas nécessairement définies par 
des expressions analytiques, mais plutôt 
par un graphe obtenu par le « tracé libre 
de la main » ; c’est l’origine physique du 
problème qui conduisit Euler a cette défi- 
nition très générale des fonctions. Daniel 
Bernoulli (1753) a donné une autre solu- 
tion de l’équation des cordes vibrantes au 
moyen de séries trigonométriques, et il 
pensait que sa solution était aussi générale 
que celle de d’Alembert-Euler, ce qu’ Euler 
a vivement contesté. On se trouvait donc 
en présence de deux notions de fonction : 
la conception formelle d’expression analy- 
tique, et la conception « ensembliste » plus 
générale de correspondance arbitraire ; le 
problème du rapport entre les deux 
notions se trouvait posé et sa solution 
devait attendre la fin du XIX e siècle. 

Tandis que Lagrange (Théorie des fonc- 
tions analytiques , 1797), restait attaché à la 
définition des fonctions par des expressions 
analytiques (sa théorie est fondée sur l’uti- 
lisation des développements en séries entiè- 
res), Fourier observa dès 1807 que la for- 
mule intégrale qui donne des coefficients du 
développement d’une fonction en série tri- 


gonométrique conservait un sens pour une 
fonction arbitraire du type de celles intro- 
duites par Euler (l’intégrale étant interpré- 
tée comme une aire dont l’existence est 
admise comme une évidence intuitive) ; il 
en déduisit, sans se poser de problème de 
convergence, qu’une fonction arbitraire 
pouvait toujours être représentée par une 
série trigonométrique. mais la notion de 
fonction arbitraire était encore extrême- 
ment vague pour lui. Les travaux de Bol- 
zano (18 17) et de Cauchy (1821) devaient 
apporter un peu de clarté sur cette notion, 
en introduisant la définition des fonctions 
continues (au sens moderne du terme, qui 
ne se réfère pas du tout aux « courbes 
continues » d’Euler) ; Cauchy développa 
une théorie de l’intégration des fonctions 
continues dégagée de l’intuition géométri- 
que, et Dirichlet (1829) parvint à démon- 
trer qu’une fonction continue monotone 
par par morceaux était effectivement repré- 
sentée par sa série de Fourier. Les 
réflexions de Dirichlet pour l’extension à 
des fonctions plus générales le conduisirent 
à une conception des fonctions arbitraires 
beaucoup plus vaste que celle de ses prédé- 
cesseurs (pour qui il s’agissait essentielle- 
ment de fonctions continues par mor- 
ceaux) : comme exemple de fonction 
discontinue, il donne la fonctionftelle que 
f(x) vaille 1 pour .y rationnel et 0 pour A' 
irrationnel (1837) ; il pose alors le problème 
de l’intégration des fonctions arbitraires 
suffisamment générales (par exemple avec 
un ensemble rare de discontinuités) : ce 
devait être l’objet de travaux de Riemann 
(pour les fonctions dont l’ensemble de dis- 
continuités est de mesure nulle) et de Lebes- 
gue (pour une classe beaucoup plus large, 
stable par des passages à la limite simple). 

P. Du Bois-Reymond montra en 1873 
que, contrairement à la conviction des 
mathématiciens, la série de Fourier d’une 
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fonction continue ne converge pas néces- 
sairement vers cette fonction. Mais 
Weierstrass parvint cependant à raccorder 
les deux notions de fonction (expression 
analytique et fonction arbitraire) en mon- 
trant qu’une fonction continue est toujours 
la somme d’une série de polynômes 
convergeant uniformément sur tout inter- 
valle fermé et borné (1885). Le problème 
de la représentation analytique des fonc- 
tions discontinues allait être abordé en 
1898 par B aire, qui caractérise les fonc- 
tions discontinues limites simples des fonc- 
tions continues (fonctions de classe 1), puis 
donne une classification des fonctions 
selon laquelle les fonctions de classe 0( sont 
des limites simples de fonctions des classes 
a' avec a' < a (a et ci peuvent être des 
ordinaux transfinis) ; Lebesgue (1905) 
montra l’existence de fonctions de chacune 
des classes de Baire et aussi de fonctions 
échappant à la classification de Baire : de 
telles fonctions n’admettent pas de repré- 
sentation analytique. 

A côté des fonctions d’une variable 
réelle, que nous avons considérées jusqu’à 
présent, les mathématiciens ont aussi étu- 
dié les fonctions de plusieurs variables, 
dont le domaine de définition est une 
partie d’un espace R/ 7 . Par ailleurs, le calcul 
des variations conduisit à la notion de 
fonction dont la variable est une courbe 
(théorie des fonctions de lignes développée 
par V. Volterra) ; M. Fréchet (1904) et 
E. H. Moore (1905) étendirent ces concep- 
tions en prenant la variable dans un 
ensemble arbitraire, et Fréchet (1909) eut 
même l’idée de considérer des fonctions 
non plus numériques, mais prenant leurs 
valeurs dans un ensemble quelconque : 
c’est la notion générale de fonction ou 
application utilisée de nos jours. 

CHRISTIAN HOUZEL 


FONCTION GAMMA 
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FONCTIONS REPRÉSENTATION & 
APPROXIMATION DES 


1 1 arrive très souvent que, dans les 
problèmes issus des mathématiques ou 
des autres sciences, les fonctions qui 
interviennent soient définies par des pro- 
cédés qui ne permettent pas d’étudier de 
manière efficace leurs propriétés. C’est le 
cas des fonctions définies comme solutions 
d’équations fonctionnelles, d’équations 
différentielles ou intégrales, d’équations 
aux dérivées partielles, ou encore de 
problèmes variationnels. Ainsi, les fonc- 
tions exponentielles sont les solutions 
suffisamment régulières de l’équation 
fonctionnelle f (x -f y) = f(x)f(y), ou 
encore de l’équation différentielle 
/'(-Y) = af(x). 

On essaie alors de représenter une telle 
fonction f sous une forme plus efficace 
pour l’étude du problème posé (existence 
et unicité, variation de /, comportement 
asymptotique, dépendance de paramètres, 
approximation numérique, prolongement 
analytique...). 

Quelques grandes méthodes se sont 
progressivement dégagées. 
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Tl s’agit en premier lieu des représenta- 
tions continues, obtenues à l’aide du calcul 
intégral. Dès le XVII e siècle, le calcul des 
primitives a été utilisé pour représenter 
certaines fonctions. Ainsi, la fonction loga- 
rithme satisfait au problème de Cauchy 
g’(t) = 1//, g(l) = 0, d’où : 

ln ' = Logf = Il F' 

Cette relation permet de prouver l’exis- 
tence du logarithme et, par suite, de 
l’exponentielle, ainsi que leur variation et 
leur comportement à l’infini (cf. EXPONEN- 
tielle et logarithme). Les représenta- 
tions intégrales interviennent aussi sous la 
forme d’intégrales dépendant de paramè- 
tres, introduites par Leibniz. Les transfor- 
mations de Fourier et de Laplace sont de 
ce type. 

Il s’agit en second lieu des représenta- 
tions discrètes et, au premier chef, des 
développements en série entière. Ainsi, 
la recherche des solutions sur R du pro- 
blème de Cauchy y = y\ jy(0) = 1, sous 
forme de série entière conduit à l’expres- 
sion : 

, x x n 

expx = 1 + — + . . . H ; + . . . 

1 ! n ! 

Cette expression fournit l’existence de la 
fonction exponentielle et une approxima- 
tion polynomiale par majoration du reste. 
Combinée avec l’équation fonctionnelle, 
elle permet aussi de calculer des valeurs 
approchées en un point; elle permet 
encore de prouver que la fonction expo- 
nentielle est prépondérante au voisinage 
de + oo sur les fonctions puissance ; enfin, 
elle permet le prolongement analytique au 
plan complexe par : 

z z n 

expz = 1 + — -F . + — : + 

1 ! n \ 


On peut alors étudier les solutions sur 
[0, + oo[ du problème de Cauchy y’ = ay , 
y’(0) = A, où A et a sont des nombres 
complexes, et établir la condition de sta- 
bilité en fonction du paramètre a , à savoir 
Re a < 0. 

Selon les problèmes, on est amené à 
utiliser d’autres types de séries : séries de 
Fourier pour les phénomènes périodiques, 
séries de polynômes orthogonaux... 

On peut aussi utiliser des procédés 
d’approximation par des suites de fonctions. 
Ainsi, la méthode du pas à pas d’Euler et 
Cauchy (cf. équations différentielles, 
chap. 7), appliquée à l’équation différen- 
tielle ÿ = y, j/(0) = 1, conduit à la rela- 
tion : 



De même, la méthode des approximations 
successives de Cauchy-Picard (cf. équa- 
tions différentielles, chap. 1), appliquée 
à cette même équation, fournit à nouveau 
le développement en série de la fonction 
exponentielle. 

Au XVIII e siècle, les problèmes de repré- 
sentation et d’approximation sont étudiés 
dans le cadre formel, le passage au 
domaine numérique étant traité de façon 
purement expérimentale, tandis qu’au 
XIX e siècle, les problèmes de convergence 
jouent un rôle central ainsi que la validité 
des opérations sur les représentations utili- 
sées (opérations algébriques, dérivation, 
intégration, sommation...). 

Les problèmes numériques conduisent 
à étudier non seulement la convergence 
mais aussi la vitesse de convergence et la 
stabilité. Ces nouvelles préoccupations 
conduisent, à la fin du XIX e siècle, à 
diversifier les modes de convergence, à 
diversifier les objets par lesquels on appro- 
che les fonctions et à rechercher des 
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procédés optimaux. L’ensemble des tra- 
vaux sur ce sujet a joué un rôle moteur 
dans la constitution de l’analyse fonction- 
nelle au début du XX e siècle. 

Enfin, dans les problèmes d’approxima- 
tion, il arrive souvent qu’on veuille appro- 
cher non pas une fonctionfmais la valeur 
surf d’une forme linéaire donnée : inté- 
grale de /, valeur de f ou d’une de ses 
dérivées en un point, coefficients de Fou- 
rier d’une fonction périodique f . .. Pour 
ce type de question, on se ramène 
bien entendu à approcher f par des fonc- 
tions plus simples, mais, ici, le point de 
vue est différent car l’étude de la rapidité 
de convergence et de l’optimisation 
sont spécifiques de la forme linéaire consi- 
dérée. 

L’enseignement de ces questions en 
France est conçu selon un plan rigide : 
étude des modes de convergence dans un 
cadre abstrait, validation des opérations 
sur les séries et les intégrales, représen- 
tation des fonctions et, enfin, résolu- 
tion de problèmes. Cette démarche est 
contraire à la pratique scientifique où 
l’approfondissement théorique des modes 
de représentation et d’approximation 
va de pair avec l’étude des problèmes 
visés. 

Les méthodes de représentation et 
d’approximation jouent un rôle central 
dans l’analyse mathématique. Elles sont 
présentées de façon synthétique dans les 
cinq premiers chapitres, qui renvoient 
pour plus de détails sur chacune des 
méthodes décrites aux divers articles 
d’analyse. Dans les trois derniers chapi- 
tres, nous approfondissons les problèmes 
d’approximation en abordant notamment 
les questions de stabilité et de vitesse de 
convergence, spécialement utiles en ana- 
lyse numérique. 


fa 

1. Convergences usuelles 
en analyse 

Pour traiter des problèmes de représenta- 
tion et d’approximation des fonctions, il 
est indispensable de préciser ce que l’on 
entend par l'écart de deux fonctions. Dans 
les cas les plus simples, on peut définir cet 
écart à l’aide d’une norme sur l’espace 
vectoriel E de fonctions considéré (cf. 
espaces vectoriels NORMÉS). 

Normes usuelles 

Considérons d’abord l’espace vectoriel 
C([â, b]) des fonctions continues à valeurs 
complexes sur un intervalle 1 = [a, b]. 

Les trois normes usuelles sont : 

- la norme de la convergence uniforme : 

NwC/") = l/ll „ = sup )/(/ ) | ; 

te i 

la norme de la convergence en moyenne : 

N,(/) = ll/lli = £ 1/(01* ; 

la norme de la convergence en moyenne 
yuadratique ; 

n 2 </) = ii/ii 2 = yJVxop*- 

Soit f une fonction positive. Cette 
fonction f est petite au sens de la norme 
N* si elle est petite partout ; cela signifie 
que son graphe est contenu dans une 
bande de hauteur petite (cf. fig. 1). La 
fonction f est petite au sens de la norme 
Nj si l’aire de la partie hachurée sur 
la figure 2 est petite. Le cas de la norme 
N 2 s’y ramène en considérant la fonction 

f 1 - 

Il apparaît aussitôt que si f est petite 
pour Noc, elle est aussi petite pour N| et N 2 
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J 

fig 1 


1 ' fc 

o - 

j i r 

a b 

Graphe de f pour N , (fj petit. 


(si l’intervalle 1 n’est pas trop grand, cela 
va sans dire...), mais fpeut fort bien être 
petite pour N, sans l’être pour N oc (phé- 
nomène de « pointe », fig. 2) Mathéma- 


fïg- 2 



a b 


j o raphe de fpour [Sj , ffj petit. _ 

tiquement, ces considérations peuvent être 
précisées par les inégalités : 

N,(/*) < (b-a)NMl 
N 2 (f) < Vb=ÏK„(f), 

qui expriment l’inégalité de la moyenne. 
De même, l’inégalité de Schwarz montre 
aussitôt que : 

VF=ÏN 2 (fl. 

Ainsi, sur un intervalle compact, la conver- 
gence uniforme implique la convergence 
en moyenne quadratique, laquelle impli- 
que la convergence en moyenne. Mais les 
réciproques sont fausses, ce qui signifie 
que ces normes ne sont pas équivalentes. 

Les trois exemples fondamentaux pré- 
cédents se généralisent au cas où il est utile 
d’introduire un poids , c’est-à-dire une fonc- 
tion TT continue sur [a, b] à valeurs réelles 


strictement positives. On pose alors 
Nï(/) NJtt/) et des définitions analo- 
gues pour les autres normes. 

Ces exemples se généralisent aussitôt au 
cas des fonctions continues sur une partie 
compacte de R/ 1 ou au cas des fonctions 
continues à support compact. 

Dans la plupart des questions de 
convergence, il est indispensable que les 
espaces normés considérés soient complets 
(espaces de Bcinach). C’est le cas de 
l’espace E = C([a, h]) muni de la 
norme N x . En revanche, ce même espace, 
muni de la norme N, ou de la norme N 2 , 
n’est pas complet. La théorie de l’intégrale 
de Lebesgue permet de plonger res- 
pectivement E dans les espaces complets 
L’([a, b]) et L 2 ([tf, h]) des classes de 
fonctions intégrables ou de carré intégra- 
ble ; ces espaces sont les complétés de E 
pour les normes N, et N 2 (cf. espaces 
MÉTRIQUES, INTÉGRATION ET MESURE). 

Les normes du type N 2 sont spéciale- 
ment intéressantes pour deux raisons. La 
première est d’ordre mathématique : elles 
dérivent du produit hermitien : 

et on dispose donc de toutes les techniques 
hilbertiennes, très efficaces. L’autre tient 
au fait que ces normes se rencontrent dans 
de nombreux domaines de la physique 
mathématique : intégrales d’énergie, méca- 
nique quantique, optimisation par la 
méthode des moindres carrés, processus 
stochastiques. 

En revanche, l’étude directe des normes 
N* est beaucoup plus délicate (cf. infra , 
chap. 7 et 8). 

Normes et dérivation 

Lorsqu’on s’intéresse à l’espace vectoriel 
C p ([a , h]) des fonctions de classe C f \ il 
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convient souvent d’introduire des normes 
faisant intervenir les dérivés successives de 
f par exemple : 

NL</> + N«(D/) + + N.ÇD Pf\ 
f- N 2 (/) + N 2 (D/) + + N 2 (D>/). 

Il est indispensable d’introduire les normes 
sur les dérivés successives, car la conver- 
gence uniforme de (f n ) vers 0 n’entraîne 
pas celle des dérivées : c’est le cas par 
exemple pour f n (t ) = (1 jri) COS nt (il s’agit 
d’un phénomène d’oscillation rapide, 
fig. 3). En revanche, ce phénomène ne se 

I fig. 3 I 


o -| > 

a b 


| Graphe d’une fonction a oscillation rapide . J 

produit pas pour les fonctions de variable 
complexe (cf. théorème de Weierstrass, in 

FONCTIONS ANALYTIQUES Fonctions ana- 
lytiques d’une variable complexe, chap. 5). 

Ici encore, le cas des normes N 2 est plus 
simple à étudier. En outre, dans bon 
nombre de questions, on peut utiliser ces 
normes pour étudier les normes grâce 
au résultat suivant : il existe des constantes 
a et (3 telles que : 

N 00 CO ^ «N 2 (f) + (3N 2 (D/> 

Les inégalités de ce type étendues à 
plusieurs variables jouent un rôle impor- 
tant dans la théorie des équations aux 
dérivées partielles ; elles ont été introduites 
par Sobolev (cf. infra , chap. 6). 

Convergences définies 

par une famille de semi-normes 

Le cadre des espaces normés ne suffit pas 
pour couvrir les besoins de l’analyse : 


certains types de convergence ne peuvent 
être décrits à l’aide d’une norme. Voici 
quatre exemples importants. 

1. Convergence uniforme sur tout com- 
pact. Soit par exemple E l’espace vectoriel 
des fonctions continues sur R. La conver- 
gence uniforme sur tout compact d’une 
suite (f n ) vers 0 signifie que, pour tout 
entier p, 

N P (/J = sup |/„(/)| — 0 pour n ~* + ». 

t'I 

2. Convergence uniforme de toutes 
les dérivées d'une fonction C°°. Par exem- 
ple, si E est l’espace des fonctions de 
classe C°° sur I = [a, b], on dit qu’une suite 
( f n ) tend vers 0 en ce sens si, pour tout 
entier p, 

N p (f n ) = — 0, pour «—►+». 

3. Fonctions de classe C°° à décroissance 
rapide ainsi que toutes leurs dérivées. Id on 
considère l’espace S des fonctions sur 
R telles que, pour tout couple (s, k) 
d’entiers naturels : 

(i+ t 2 y |DVXOi~*o, pour 

On introduit la famille dénombrable de 

semi-normes : 

N i( * (f) = sup (1 + f 2 y I D*/ (O | • 

tER 

La convergence dans S d’une suite (f n ) 
vers 0 signifie que, pour tout couple (s, k), 
N,,(T„)-o. 

Cet espace joue un rôle fondamental 
dans la théorie de la transformation de 
Fourier, dans le cadre des distributions 
tempérées (cf. distributions, chap. 4). 

Ces trois exemples se généralisent aux 
espaces R", 

Dans ce type de situation, où inter- 
vient une famille dénombrable de semi- 
normes, que l’on peut ranger en une suite 


364 




FONCTIONS REPRÉSENTATION & APPROXIMATION DES 


Np, on peut décrire la convergence au 
moyen d’une distance invariante par trans- 
lation : 

dig, h) = J (h —g), 

où : 

_L ÔC 

J</) = £ i inf(1 ’ N ^))' 

p = 0 

Les espaces métriques ainsi obtenus sont 
complets (cf. espaces MÉTRIQUES). Ce cas se 
distingue de celui des espaces normés par 
la perte de V homogénéité. 

4. Convergence simple. Soit par exem- 
ple E l’espace vectoriel des fonctions 
définies sur R à valeurs complexes. On dit 
qu’une suite (f } ( ) converge simplement vers 
0 sur R si, pour tout point A* de R, la suite 
numérique converge vers 0. On 

introduit les semi-normes (c’est-à-dire 
qu’un élément non nul peut avoir une 
semi-norme nulle) : 

N,</) =!/(*)| ■ 

Cette fois le cadre des espaces métri- 
ques ne suffit plus pour décrire ce type de 
convergence, car la famille (N Y ) n’est plus 
dénombrable. D’ailleurs, contrairement 
aux apparences et à la terminologie ( !), ce 
mode de convergence est assez pathologi- 
que car les propriétés stables sont peu 
nombreuses. 

Les quatre exemples précédents relè- 
vent de la théorie des limites projectives 
d’espaces semi-normés, qui se place dans le 
cadre général de la théorie des espaces 
vectoriels topologiques localement conve- 
xes (cf. espaces vectoriels TOPOLOGIQUES, 
chap. 1). Dans les trois premiers exemples, 
les familles d’espaces normés sont dénom- 
brables et on obtient donc des espaces de 
Fréchet , ce qui n’est pas le cas de l’exem- 
ple 4. 


Comparaison des convergences 
simple et uniforme 

Il y a deux cas importants où la conver- 
gence simple implique en fait la conver- 
gence uniforme sur tout compact. 

1. Cas équilipschitzien (théorème 
d’Ascoli classique). Soit A un espace 
métrique compact et (f n ) une suite d’appli- 
cations de A dans C. On suppose : 

a) la suite (f n ) converge simplement 
vers f sur A ; 

b) la suite (f n ) est équilipschitzienne 
dans un rapport k, c’est-à-dire : 

V» Vx, y CA, |/*(*) -/„ (V)| < kd(x,y). 

Alors, la fonction limite f est 
k-lipschitzienne et la convergence est uni- 
forme sur A. 

2. Cas des suites monotone .- (théorème 
de Dini). Soit encore A métrique compact 
et f, : A — ► R+. On suppose : 

a) pour tout n, la fonction f n est conti- 
nue sur A ; 

b) la suite (f n ) est décroissante, c’est-à- 
dire f n +\(x) ^ fn( X ) P our t°Ut A G A ; 

c) la suite (f n ) converge simplement 
vers 0. 

Alors la convergence est uniforme sur A. 

Convergences avec conditions 
sur les supports 

Les convergences avec conditions sur les 
supports jouent un rôle important dans les 
problèmes liés au calcul intégral et à ses 
extensions (mesures de Radon et distribu- 
tions). 

Pour les mesures, considérons par 
exemple l’espace vectoriel E = K(R) des 
fonctions à valeurs complexes continues 
sur R et à support compact. On est amené 
à considérer les suites (f n ) d’éléments de E 
convergeant vers 0 au sens suivant : 

a) f n converge vers 0 uniformément sur 

R ; 
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b) il existe un intervalle compact 
K = [a, b] tel que, pour tout n , le support 
de f n est contenu dans K. 

On introduit donc les espaces vectoriels 
constitués des fonctions / dont le 
support est contenu dans [— /?, p\ muni de 
la norme : 

N p (f)= sup [/(O |. 

— p < t < p 

La convergence d’une suite (ff) vers 0 
signifie alors que les/, appartiennent à un 
même espace X /; et convergent vers 0 dans 
cet espace. 

Pour la théorie des distributions, il 
convient de remplacer X(R) par 
l’espace 1)(R) des fonctions sur R à 
support compact, et la condition (a) par la 
condition : 

a) pour tout entier k, la suite D k f n 
converge vers 0 uniformément sur R 
(cf. supra, exemple 2). 

On introduit les espaces ‘D^R) munis 
de la distance introduite ci-dessus dans 
l’exemple 2. La convergence d’une suite/, 
vers 0 signifie alors que les f n appartiennent 
à un même espace 2/ et convergent vers 0 
dans cet espace. 

Les espaces vectoriels X(R) et ®(R) 
sont complets (ce qui signifie ici que chacun 
des espaces SC, (R) ou 2/(R) est complet). 

Ces deux exemples se généralisent faci- 
lement au cas des fonctions définies sur un 
ouvert U de R' 7 , en remplaçant les inter- 
valles [— p, p] par une suite de compacts 
(K„) tels que K /; soit contenu dans l’inté- 
rieur de K /?+1 et que U soit la réunion des 
K„ (suite exhaustive de compacts de U). 

Ils relèvent de la théorie des limites 
inductives d’espaces semi-normés, qu’il 
n’est ni commode ni naturel de placer dans 
le cadre de la théorie des espaces vectoriels 
topologiques mais qu’il convient plutôt de 
décrire grâce au concept d’espace vectoriel 


bornologique de type convexe (cf. espaces 
vectoriels topologiques, chap. 3). 


2. Représentations 
par des intégrales 

Forme intégrale des restes 
Dans les problèmes de calcul différentiel, 
la forme intégrale des restes de dévelop- 
pements en séries ou de développements 
asymptotiques est essentielle pour le 
contrôle de ces restes : formule de Taylor 
classique, formule interpolatoire de 
Lagrange-Hermite (cf. infra , chap. 4). À la 
formule de Taylor se rattache le théorème 
de division des fonctions différentiables \ 
Soit f une fonction de classe C p sur un 
intervalle 1 de centre a avec f(a) - 0 ; 
alors f peut s’écrire sous la forme : 

/(•*)= (•* ~a)g{x), 

où g(x) = uf\a+ (x — a)u)du. 

Il en découle queg est de classe C /, _l et que, 
pour I compact, on a, pour tout entier 
k ^ p — 1, la majoration : 

MifeKpLM* +,(/), 

où M,(h) désigne le maximum du module 
de la dérivée n-ième de h sur I. 

Ce théorème se généralise aussitôt à 
plusieurs variables : Si f(a) = 0, avec 
a = (tf|, . . . . a,,), alors, pour tout x = (jCj, 

. ..) x,,), on a : 

/(*)= (*i— 0i)£i(*) + ... + {x„— a„)g n (x), 

où les fonctions g, sont de classe C /J-1 si f 
est de classe C p , Ce théorème est à la base 
de la théorie des idéaux de fonctions 

différentiables (cf. CALCUL INFINITÉSIMAL 

Calcul à plusieurs variables, chap. 3). 
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Transformations de Fourier 
et de Laplace 

Dans les problèmes d’analyse harmonique 
des phénomènes non périodiques (cf. ana- 
lyse HARMONIQUE , chap. 3), on utilise la 
transformation de Fourier, réelle ou com- 
plexe. définie par la relation : 

(1) fc) = \*y(f)e-- u '°dt 

(ou des formes analogues selon les 
auteurs), et la formule d’inversion : 

(2) f(t) = ^J(x)e>‘™dx- 

intuitivement, la formule (1) décompose le 
signal t ► f(t ) suivant toutes ses compo- 
santes harmoniques (analyse harmonique 
du signal), tandis que la formule (2) permet 
de reconstituer ce signal /à partir de ses 
composantes (synthèse harmonique du 
signal). 

Dans le cas des fonctions définies dans 
[0, + oo[, qui interviennent dans l’étude 
des régimes non permanents, on utilise la 
transformation de Laplace : 

c/oo = J # 7(o«—* 

(cf. calcul SYMBOLIQUE). Cette transforma- 
tion intervient aussi dans la résolution des 
équations différentielles à coefficients algé- 
briques, notamment l’équation hypergéo- 
métrique (cf. calculs asymptotiques, 
chap. 6). 

Les transformations de Fourier et de 
Laplace se généralisent aussi aux espaces 
R" et jouent alors un rôle fondamental 
dans la théorie des équations aux dérivées 
partielles linéaires (cf. équations aux DÉRI- 
VÉES partielles - Théorie linéaire) et plus 
généralement des équations de convolu- 
tion. Elles jouent aussi un rôle de premier 
plan en calcul des probabilités, sous la 


forme des fonctions caractéristiques d’une 
loi de probabilité, dans la théorie des 
processus stochastiques du second ordre et 
en mécanique quantique. 

On peut aussi rattacher à l’analyse 
harmonique la transformation de Mellin, 
définie par la relation : 

/(*) = J “/(0 t-'dt, 

qui n’est autre que la transformation de 
Fourier sur le groupe multiplicatif R+ 
dont la mesure invariante est dt/î (cf. 
analyse harmonique) . Cette transforma- 
tion intervient notamment dans les pro- 
blèmes multiplicatifs de la théorie des 
nombres (cf. théorie des nombres - Théo- 
rie analytique) ; la fonction gamma d’Euler 
(cf. fonction GAMMA) joue ici un rôle 
central. 

Emploi de la dualité 

La dualité consiste à représenter une 
fonction comme une forme linéaire sur un 
espace E de fonctions convenablement 
choisi. Ainsi, toute fonctionf’de puissance 
/Même intégrable définit une forme linéaire 
continue Tf sur l’espace V 1 des fonctions 
de puissance q-ième intégrdble, pour 
1 jp + 1/gr = I, par la formule : 

T/(qp) = £/(*)<? <x)dx; 

lorsque 1 < p < + oo. on obtient ainsi 
toutes les formes linéaires continues sur L £/ 
(cf. intÉgRAtion et mesure, chap. 4). 
Mais, en utilisant d’autres espaces fonc- 
tionnels, on obtient ainsi des objets plus 
généraux que les fonctions, Cela tient au 
fait que, dans de nombreux problèmes, les 
opérations de passage à la limite nécessi- 
tent de sortir du cadre de la théorie des 
fonctions. Considérons par exemple une 
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suite ((p^) de fonctions continues positives 
sur R telles que, pour tout n , 

f <p«(0* = 1 

JlR 

(cf. distributions, fig. 1), et dont la masse 
se concentre à l’origine, c’est-a-dire que, 
pour tout a > 0, 

I <p„ (/ ) dt —* ► 0 pour n 

Intuitivement, les fonctions cp,, tendent 
vers la « fonction » 5 de Dirac, que les 
physiciens définissent par ô(0) = + oo, 
Ô(jc) = 0 pour x # 0 et JÔ(7 ) dt = 1. 
Mais il n’existe aucune fonction, au sens 
précis de ce concept en mathématiques, 
satisfaisant à ces relations. Il suffit de 
considérer, pour s’en convaincre, 26. On 
tourne alors la difficulté de la manière 
suivante : on démontre d’abord que, pour 
toute fonction f continue à support com- 
pact sur R, 

(!) J R /(r)cp„(O*-/(0). 

À toute fonction cp continue sur R, on 
associe la forme linéaire : 

sur l’espace vectoriel E = JC( R) des fonc- 
tions continues à support compact. La 
relation (1) s’interprète alors de la manière 
suivante : 


T ï„^ 5, « -* + 00, 

où Ô est la forme linéaire sur E telle que 
f-f(0). En outre, l’application (p 
permet de plonger l’espace JC (R) dans son 
dual topologique, à savoir, l’espace A(R) 
des mesures de Radon sur R (cf. intégra- 
tion et mesure) . Lorsque E est l’espace 


‘B(R), on obtient les distributions (cf. 

DISTRIBUTIONS) . 

Le principal intérêt de ces généralisa- 
tions de la notion de fonction est de fournir 
un cadre théorique permettant d’opérer en 
toute sécurité sur les représentations 
(cf. infra , chap. 5). L’utilisation des trans- 
formations de Fourier et de Laplace pour 
le calcul symbolique et les équations aux 
dérivées partielles est à cet égard exem- 
plaire. 

Noyaux de convolution 

Les noyaux de convolution constituent un 
autre exemple très intéressant de représen- 
tation intégrale. Ils interviennent d’abord 
dans la résolution des équations différen- 
tielles à coefficients constants avec second 
membre P(D)/ = b,f (0) = 0 ; si on intro- 
duit la solution élémentaire E définie par la 
relation P(D)E = ô, où ô est la mesure de 
Dirac, alors f= E * b, c’est-a-dire : 

f(x) = J*E(x — t)b(t)dt. 

Cette méthode s’applique aussi aux équa- 
tions aux dérivées partielles à coefficients 
constants (cf. équations aux DÉRIVÉES par- 
tielles » Théorie linéaire). En particulier, 
dans le cas du laplacien en dimension trois, 
on a : 



— 4irô ; 


la solution élémentaire est donc E(s) 
= l/4ïïj|x||. Le potentiel V, solution de 

l’équation de Poisson AV = — 471(1, où p 
est à support compact, est donc donné par 
l’intégrale de convolution : 



mOO 


dy. 


De même, la résolution du problème de 
Dirichlet pour le cercle fait intervenir le 
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noyau de Poisson (cf. potentiel et FONC- 
TIONS HARMONIQUES, chap. 1). 

L'importance des noyaux de convo- 
lution s'explique par le fait qu'ils peu- 
vent décrire tous les problèmes linéaires 
invariants par translation de la variable. 
Plus précisément, soit f une fonction 
continue ; alors, l'application u f qui, à 
tout élément cp de 2), associe /* (p est 
une application linéaire continue de £) 
dans l'espace £ des fonctions indéfini- 
ment dérivables. En outre, elle est inva- 
riante par translation sur la variable, 
c'est-à-dire qu'elle commute à tous les 
opérateurs de translation T (/ définis par 
T„<p(.v) = cp(.Y a). 

Le problème central est alors de savoir 
si, inversement, toute application linéaire 
continue invariante par translation est de 
la forme précédente. La réponse est néga- 
tive dans le cadre de la théorie des fonc- 
tions (penser par exemple à l'application 
identique), mais elle est positive dans le 
cadre de la théorie des distributions : si w : 
3) — » T)', linéaire continue, commute aux 
translations, alors il existe une distribu- 
tion T et une seule tële que u{ cp) = T* cp. 
En outre, u se prolonge en une application 
linéaire continue ü de f/ dans ‘J)' et, dans 
ces conditions, T = U (6). Dans tous les 
théorèmes de théorie du signal et d'auto- 
matique, ce résultat joue un rôle fonda- 
mental ; T s'appelle la « fonction » de 
transfert ou réponse impulsionnelle 
(Cf. calcul SYMBOLIQUE). 

intégrales de contour 
La formule intégrale de Cauchy, fonda- 
mentale dans la théorie des fonctions de 
variable complexe (cf. fonctions ANALY- 
TIQUES Fonctions analytiques d'une 
variable complexe, chap. 5), s’inter- 
prète aussi dans ce cadre ; on utilise cette 


fois la solution élémentaire de l’opéra- 
teur d/df ■ 

dz 2 \ âx 1 dy )’ 

à savoir : 


La méthode se généralise aux fonctions 
analytiques de plusieurs variables comple- 
xes. 

La formule intégrale de Cauchy conduit 
à étudier plus généralement la transforma- 
tion de Hilbert : 



où /est une fonction continue définie sur 
un arc y du plan complexe. Cette trans- 
formation intervient dans le problème des 
moments. 

Elle conduit aussi à la recherche de 
représentations des fonctions holomor- 
phes et méromorphes par des intégrales de 
contour. Le cas des fonctions hypergéo- 
métriques en est un exemple significatif 
(cf. calculs asymptotiques chap. 6). 

Noyaux intégraux 

La représentation des fonctions par 
des noyaux intégraux s'applique aussi à 
l'étude des phénomènes linéaires non 
nécessairement invariants par transla- 
tion. C'est le cas pour la résolution des 
équations linéaires à coefficients non 
constants. 

On introduit à cet effet la résolvante de 
l'équation sans second membre : 

x\t ) — A(t )x(t ) = 0, 

où, pour tout f, A(t ) est une matrice carrée 
d'ordre n à coefficients complexes et x(t ) 
un élément de C" : c'est la fonction R(.ç, t ), 
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à valeurs vectorielles, solution du pro- 
blème de Cauchy : 

~(*.0 = A(OR(*,o, R(*,*)= l„ 

Dans ces conditions, l’unique solution du 
problème de Cauchy : 

x qt ) = A (t )*(r ) + b(t ), *(-0 = o, 

est donnée par : 

x{t) = | r R(a, t )b(o)do 

(cf. équations différentielles). Placée 
dans le cadre de la théorie des distribu- 
tions, cette méthode s’étend aux équations 
aux dérivées partielles linéaires grâce au 
concept de noyau élémentaire (cf. équa- 
tions aux dÉrivÉes partielles “ Théorie 
linéaire). 

Les noyaux intégraux interviennent 
aussi dans la théorie des fonctions de 

Green (cf. équations DIFFÉRENTIELLES, 

Chap. 3; POTENTIEL ET FONCTIONS HARMO- 
NIQUES) , dans la résolution des équations 
intégrales (cf. équations INTÉGRALES) et, 
plus généralement, dans la théorie des 
opérateurs. Par exemple, si K est une 
fonction de carré intégrable sur R 2 , alors, 
pour toute /G L*(R), la fonction g définie 
presque partout par la relation : 

g(x) = ^K(x,y)f(y)dy 

appartient encore à L’(R) et l’application 
f*—* g est un endomorphisme continu de 
l’espace de Hilbert L 2 . Mais, inversement, 
tout endomorphisme continu de L 2 n’est 
pas nécessairement de cette forme : on 
obtient ainsi seulement les opérateurs de 
Hilbert- Schmidt (cf. théorie spectrale, 

chap. 2). 

Pour obtenir un énoncé satisfaisant, le 
cadre de la théorie des fonctions ne suffit 


pas ; il convient d’utiliser la théorie des 
distributions. Soit K une distribution sur 
R 2 ; alors, pour toute fonction ip G ED(R), 
l’application : 

T r<P K c , K(x,y)y(x)\\)(y)dxdy 

SSr> 

est une distribution sur R et l’application 
w K qui à ip associe est une application 
linéaire de 2) (R) dans ‘a’ (R), continue en 
ce sens que, si cp„ tend vers 0 dans 2), alors 

tend vers 0 dans 2)'. Le célèbre 
théorème des noyaux de Laurent Schwartz 
affirme que, réciproquement, toute appli- 
cation linéaire continue de 2) dans 2)' est 
de cette forme, c’est-à-dire peut être définie 
par un noyau distribution. 

3. Représentations par des séries 
Séries entières 

La somme d’une série entière de rayon de 
convergence R est une fonction indéfini- 
ment différentiable dans son disque de 
convergence, et les dérivées successives à 
l’origine sont données par la formule de 
Taylor. 

Inversement, dans de nombreux pro- 
blèmes, il est utile de représenter une 
fonction f de classe C°° par sa série de 
Taylor. Mais ici la situation est très diffé- 
rente selon qu’on se place sur le corps des 
nombres complexes ou sur celui des nom- 
bres réels. Dans le premier cas, la série de 
Taylor converge toujours vers la fonction 
dans tout disque où / est de classe C 03 
(d’ailleurs la dérivabilité suffit ; cf. fonc- 
tions analytiques ■ Fonctions analytiques 
d’une variable complexe, chap. 2). Dans le 
cas du corps des réels, il existe des fonc- 
tions C 33 dans un intervalle ]— a, a [ dont la 
série de Taylor converge, mais vers une 
autre fonction : c’est le cas de la fonction 
f définie par f(0) = 0, f(x) = exp(- 1 / 
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A' 2 ), exemple introduit par Cauchy dans 
son Cours d'analyse (1821). Il existe aussi 
des fonctions C x dont la série de Taylor a 
un rayon de convergence nul : c’est le cas 
de la fonction : 


x^'Y j ~wp(in l x). 

n = 0 

Plus précisément, Émile Borel a montré 
que, pour toute suite (a,) de nombres 
complexes, il existe une fonction C 00 sur R 
telle que, pour tout n,f {n \ 0) = a n . Autre- 
ment dit, l’application de Taylor T de 
C”(R) dans l’anneau C[[X]] des séries 
formelles à coefficients complexes, définie 
par : 


T:/h 


2 


f {n K 0 ) 

n ! 


X-, 


est surjective. 

Il n’est donc pas possible, comme l’a 
tenté Lagrange dans la Théorie des f 0 H C ■ 
tions analytiques (1797), de fonder le calcul 
différentiel sur le développement en série 
de Taylor. 

Ce phénomène est à l’origine du 
concept de fonction analytique réelle : ce 
sont les fonctions de classe C°° dans un 
intervalle ouvert I de R développables en 
série de Taylor au voisinage de chaque 
point a de I. Ces fonctions peuvent être 
caractérisées parmi les fonctions C°° dans 
1 à l’aide d’inégalités du type suivant, 
portant sur la rapidité de croissance des 
modules des dérivées successives : pour 
tout intervalle compact K contenu dans 1, 
il existe des constantes C K et r K telles que 
l’on ait, pour tout entier n : 

(1) M Kn (f) Ç C K n !(r K )", 

°ù: M K .„(/)=sup D»/(0|; 

tEK 


ce résultat est dû à Pringsheim. 


Bien entendu, en tout point a E I, 
l’application de Taylor T„ est injective sur 
le sous-espace vectoriel ciD des fonctions 
analytiques dans I. Plus généralement, on 
dit qu’un sous-espace vectoriel V de C”(I) 
est quasi analytique si la restriction de T„ 
à V est injective. 

La condition (1) conduit plus généra- 
lement à considérer une suite croissante 
h = ((3„) tendant vers + oc et logarithmi- 
quement convexe, c’est-à-dire vérifiant 

^ P/f-t (Wb et à introduire la SOUS- 
algèbre V/, de C”(I) constituée des fonc- 
tions f telles que l’on ait : 

(2) M Kfl (/) 

L e théorème d e Denjoy-Carleman 
affirme que W h est quasi analytique si et 
seulement si la série de terme général 
((3„) est divergente. 

Si V h est quasi analytique, ses éléments 
ont des propriétés très rigides : en parti- 
culier, le principe du prolongement analy- 
tique est valable et V/,H Î)(I) est réduit à 
{0}. Au contraire, si V /? n’est pas quasi 
analytique, 3)/,(I) = V/, Pi ‘D(I) est dense 
dans 2)(I) et les propriétés de V h ressem- 
blent à celles de D(I). L’exemple le plus 
intéressant est fourni par les classes de 
Gevrey, où (3^ = ( n !) T , s > É auquel cas 
V h se note ‘D,(I) ; cet espace étant muni 
d’un type de convergence analogue à 
celui de ‘D(I), son dual topologique est 
constitué des ultradistributions : il est 
analogue à Û)'(I) mais beaucoup plus 
grand. Ces espaces interviennent dans 
l’étude des problèmes aux limites des 
équations aux dérivées partielles, où l’on 
introduit aussi l’espace vectoriel des fonc- 
tionnelles analytiques, c’est-à-dire le dual 
topologique de C-(I), dont les propriétés 
diffèrent profondément de celles des dis- 
tributions. 
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Séries de polynômes 

Puisque les séries entières ne suffisent pas 
pour représenter des fonctions suffisam- 
ment générales (continues, de classe C Â ), il 
convient de considérer des séries de poly- 
nômes. D’après le théorème de Weier strass 
(1886), toute fonction continue sur un 
intervalle compact est développable en 
série uniformément convergente de poly- 
nômes. Le point de vue de Newton et de 
Lagrange se trouve ainsi justifié, mais dans 
un cadre théorique plus approfondi. 
Weierstrass considère d’ailleurs que ce 
résultat constitue une définition construc- 
tive de la notion de fonction continue. 

Les séries de polynômes et de fractions 
rationnelles sont aussi utiles dans la repré- 
sentation des fonctions d’une variable 
complexe lorsque le domaine de définition 
n’est plus un disque ou dans le cas 
où la fonction présente des singularités 
(cf. Développements eulériens, in expo- 
nentielle et logarithme; Théorème 
de Runge, in FONCTIONS ANALYTIQUES— 

Fonctions analytiques d’une variable com- 
plexe, chap. 8 et 9). Dans d’autres ques- 
tions, il est commode d’utiliser des 
produits infinis (cf. Théorème de Runge, in 
fonctions ANALYTIQUES - Fonctions analy- 
tiques d’une variable complexe, chap. 9), 
ou des séries de Dirichlet. 

Analyse algébrique 

Les manipulations sur les séries entières et 
ces autres objets constituent le cœur de 
1 "analyse algébrique , développée dans un 
cadre formel par Euler dans Y Introductio in 
analysin infinitorum (1748) et reprise dans 
le cadre du concept de convergence par 
Cauchy. L’analyse algébrique intervient 
dans la théorie des fonctions transcendan- 
tes élémentaires (cf. exponentielle et 
logarithme) et, plus généralement, des 


fonctions spéciales (cf. fonctions de bes- 

sel; fonctions analytiques - Fonctions 

elliptiques et modulaire ; fonction 
gamma) ; elle intervient aussi dans les 
problèmes arithmétiques et combinatoires 
grâce au concept de série génératrice : 
séries entières pour les problèmes additifs, 
séries de Dirichlet pour les problèmes 
multiplicatifs (cf. analyse COMBINATOIRE, 
théorie des NOMBRES * Théorie analytique 
des nombres). 


Séries de Fourier 

Dans les problèmes d’analyse harmonique 
des phénomènes périodiques (de période 1 
pour fixer les idées), on utilise le dévelop- 
pement des fonctions périodiques en série 
de Fourier : 


/(*) 


- 2 > 

n€L 


( f)e™' 


où le coefficient de Fourier a n est donné 
par : 


<x„(/) = j7(Oe- 2 '”'*. 


La problématique est ici la même que 
pour la transformation de Fourier. Les 
deux cadres théoriques principaux de vali- 
dité de cette représentation sont l’espace 
des fonctions de carré intégrable sur [0, 1] 
et l’espace des distributions périodiques 

(Cf. DISTRIBUTIONS ; SÉRIES TRIGONOMÉTRI- 

ques) . C’est d’ailleurs l’étude des séries de 
Fourier qui a constitué une des principales 
motivations de la construction de F inté- 
grale de Lebesgue et de l’espace L 2 . 

La représentation par les séries de 
Fourier s’insère dans un cadre plus géné- 
ral : pour étudier un opérateur auto-adjoint 
d’un espace hilbertien de fonctions, on 
développe les fonctions en série de fonc- 
tions propres de cet opérateur, ce qui est 
possible lorsqu’elles constituent une base 
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hilbertienne ; le cas des séries de Fourier 
est relatif à l’opérateur de dérivation. Le 
cas des équations différentielles conduit à 
la théorie de Sturm-Liouville et à l’intro- 
duction des systèmes classiques de 
fonctions orthogonales (cf. équations dif- 
férentielles, chap. 3;polynômes ortho- 
gonaux) . L’étude des équations intégrales, 
en particulier des équations de Fredholm, 
qu’il convient de placer dans le cadre des 
opérateurs compacts, utilise aussi ce type 
de représentation (cf. équations intégra- 
les j théorie spectrale) . 

Cette même méthode s’applique encore 
à l’étude de problèmes relatifs aux équa- 
tions aux dérivées partielles ; une idée 
centrale pour déterminer les fonctions 
propres consiste ici à se ramener au cas des 
équations différentielles par la méthode de 
séparation des variables. 


4. Approximation par des suites 

Le problème de la représentation des 
fonctions comme limites de fonctions plus 
simples est intimement lié à celui de 
l’approximation des fonctions, qui ne 
relève pas uniquement de problèmes 
d’analyse numérique mais constitue un 
mode de représentation utile dans des 
questions d’ordre théorique : problèmes 
d’existence et d’unicité, démonstration de 
théorèmes par passage à la limite (argu- 
ment de densité...). Les procédés 
d’approximations sont très divers ; nous 
avons retenu cinq méthodes importantes. 

Méthodes convoi utives 

On utilise l’effet régularisant de la convo- 
lution : si fest une fonction peu régulière 
et si cp est très régulière, alors /* cp est aussi 
régulière que cp. En introduisant une appro- 
ximation de l'unité , c’est-à-dire une suite 


(cp w ) de fonctions très régulières conver- 
geant vers la mesure de Dirac ô (cf. supra, 
chap. 2), on approche /par des fonctions 
très régulières /* (f n =f v 

Le fait que les fonctions tp, 7 soient a 
valeurs positives joue ici un rôle essentiel. 
Ce procédé d’approximation est particu- 
lièrement intéressant : en effet, lorsquefest 
de classe O 7 , non seulement f n converge 
vers / mais, pour tout k ^ /?, les dérivés 
D k f n convergent vers D k f En prenant pour 
(p w des fonctions C°° à support compact, on 
obtient la densité des fonctions C°° dans la 
plupart des espaces fonctionnels classiques 
et même des espaces de distributions ; 
ainsi, pour tout ouvert U de R", l’espace 
vectoriel 1D(U) des fonctions de classe C°° 
dans U à support compact est dense dans 
l’espace vectoriel K(U) des fonctions 
continues à support compact contenu 
dans U. 

En prenant pour (p n des fonctions poly- 
nomiales, on obtient une démonstration du 
théorème d’approximation polynomiale de 
Weierstrass ; on peut prendre par exemple 
le noyau de Landau : 


<P«( O 


a fl (l-/ 2 )« si \t | < 1 
0 si j 1 1 ^ 1 , 


où ü n est une constante de normalisation, 
c’est-à-dire telle que : 

]>(')* = 1 - 


La même méthode s’applique aussi à 
l’approximation uniforme des fonctions 
continues périodiques : on peut prendre 
par exemple les noyaux de Fejer (cf. séries 
trigonométriques , chap. 1) ou de La 
Vallée Poussin : 


qp n (f ) = a n (cos lït ) 2n , 

où a n est une constante de normalisation. 
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On notera que, en revanche, le noyau de 
Dirichlet (cf. séries trigonomÉtriques, 

chap. 1) ne convient pas pour toutes les 
fonctions continues, ce qui se traduit par 
le fait que la série de Fourier d’une 
fonction continue peut diverger ; cela tient 
au fait que ce noyau n’est pas positif. Mais 
la convergence a bien lieu si la fonction est 
suffisamment régulière, c’est-à-dire si le 
module de continuité (cf. infra , chap. 7) 
décroît assez vite. 

Méthodes de troncature 
Il s’agit d’approcher des fonctions définies 
sur un ouvert U de R" par des fonctions 
à support compact contenu dans U. A cet 
effet, on utilise une suite exhaustive (K,) de 
compacts de U (cf. supra , chap. 1) et on 
construit une troncature universelle, c’està- 
dire une suite (x n ) de fonctions telles que 
0 ^ Xn < 1, Xn = 1 sur K„et X„+i = 0 en 
dehors de K„ +1 . 

On approche alors f par la suite 

fn 

Dans des questions d’intégration, on 
peut prendre pour y^ n la fonction caracté- 
ristique de K,. Dans d’autres problèmes, il 
faut opérer moins brutalement. Par exem- 
ple, en prenant continue, on prouve que 
l’espace vectoriel X(U) des fonctions 
continues à support compact contenu dans 
U est dense dans l’espace vectoriel C,(U) 
des fonctions continues tendant vers 0 au 
bord de U (muni de la norme de la 
convergence uniforme) ou encore dans 
l’espace L 2 (U) des classes de fonctions de 
carré intégrable dans U (muni de la norme 
quadratique). 

De même, on peut prendre y^ n de classe 
C 00 ; on prouve alors que l’espace vectoriel 
'D(R) des fonctions de classe C°° à support 
compact est dense dans l’espace vectoriel 
S(R) des fonctions de classe C°° à décrois- 
sance rapide. 


On peut conjuguer les méthodes de 
convolution et de troncature pour montrer 
par exemple que l’espace vectoriel 3) (U) 
est dense dans l’espace vectoriel C(U) pour 
la convergence uniforme sur tout compact 
(cf. supra, chap. 1). 

Méthodes itératives 

II s’agit ici de méthodes où l’algorithme 
d’approximation de / est défini par une 
relation de récurrence. En voici trois 
exemples, dont les deux premiers sont 
d’importance capitale. 

Méthode des approximations successives 
Pour prouver l’existence et l’unicité et 
étudier les solutions d’équations portant 
sur des fonctions, on s’inspire du cas des 
équations numériques en généralisant la 
méthode des approximations successives 
au cadre abstrait des espaces métriques 
complets (cf. espaces métriques, chap. 3). 
Ce schéma s’applique en particulier au 
théorème d’inversion locale et des fonc- 
tions implicites (cf.CALCUL INFINITÉSIMAL - 
Calcul à plusieurs variables, chap. 2), aux 
équationsdifférentiellesgrâceàlaméthode 
de Picard (cf. équations différentielles, 
chap. 1,2 et 4), aux équations intégrales (cf. 
équations intégrales, chap. 2) et aux équa- 
tions aux dérivées partielles. 

Méthode de compacité 

Pour étudier les solutions d’une équation 
du type f(x) = b, où f est une application 
continue d’un espace métrique compact K 
dans un espace de Banach E et où b est un 
élément donné de E, on construit une suite 
(à'„) de solutions approchées, c’est-à-dire 
telles que f (x,) tende vers b. Dans ces 
conditions, l’équation f(x) = b admet au 
moins une solution et, si l’on suppose en 
outre l’unicité d’une telle solution a , la 
suite (s,) tend vers a. 


374 



FONCTIONS REPRÉSENTATION & APPROXIMATION DES 


Cette méthode s’applique d’abord aux 
méthodes d’analyse numérique matricielle 
(méthode de Jacobi). Mais elle s’applique 
aussi aux problèmes d’analyse fonction- 
nelle. Pour démontrer qu’un ensemble K 
de fonctions définies sur un espace com- 
pact A à valeurs dans un espace E, de 
dimension finie pour simplifier l’énoncé, 
est compact, on utilise le théorème suivant, 
dû à Ascoli. On munit l’espace C(A, E) de 
la norme de la convergence uniforme. Il est 
alors équivalent de dire : 

a) K est compact ; 

b) K satisfait aux deux conditions sui- 
vantes : 

K est fermé ; 

™ K est équicontinu, c’est-à-dire, Vs E A, 
V& > 0, 3r| tel que : 

Vx CK , Vf G A, 

(d(t f s) < n=> II* (O —*(*)! < 8 )- 

Lorsque, par exemple, A est un inter- 
valle [a, b] de R et E = C, l’hypothèse 
d’équicontinuité est satisfaite lorsque K est 
constitué des fonctions x de classe C 1 telles 
que || Dx I* ^ P, ou, plus généralement si 
Dx est de carré intégrable et si 

Méthode de Pacte : fractions continues 

On opère par analogie avec le développe- 
ment des nombres en fraction continue 
(cf. approximations dioph antiennes, 
chap. 2). 

Une telle méthode se décrit à l’aide du 
schéma général suivant. 

Soit f une fonction définie sur un 
intervalle 1 de centre 0. Un développe- 
ment de f en fraction continue est de la 
forme : 

/(■*) = a 0 + 


qu’on écrit avec la notation : 


f(x) = a Q + xja[ + xjâ~ 2 + x[Z 


cela signifie que les fractions rationnelles : 

r n (x) =a 0 + xjâ l +xjZ Jâ~ n 

convergent vers f uniformément sur tout 
compact de I. Cette méthode a été étudiée 
systématiquement par Padé (1892). Déjà, 
Euler avait montré que : 


1 -f xjï + xp- 2 4- x\ — 3 4 xJ 2 


et avait déduit de développements analo- 
gues l’irrationalité de e. Lambert avait 
obtenu de même le développement en 
fraction continue de tanx et en avait 
déduit l’irrationalité de TT. Avec le déve- 
loppement de l’analyse numérique, lié à 
celui des ordinateurs, ce type d’approxi- 
mation des fonctions transcendantes élé- 
mentaires par des fractions continues a 
connu un regain d’intérêt. Ainsi, pour le 
calcul de e v , avec lnVJ ^ x ^ InVT, la 
formule : 


* , *. + *!**+ *1« 4 

2 1 + i 

avec k 0 = 1,000 000 000 000 327 1, fc, = 
0,107 135 066 4.56 464 2, k 2 = 0, 000 594 
589 869 018 8 et k 3 = 0, 02 3 801 733 157 
418 6, fournit une précision de 1,4 . 10 l4 . 
Pour obtenir la même précision avec des 
polynômes, il faudrait monter au degré 15. 

Mais cette méthode s’applique aussi à 
des problèmes d’ordre plus théorique. Soit 
par exemple f une fonction méromorphe 
dans un disque de centre 0 et régulière à 
l’origine. Alors f est développable en série 
de Taylor : 


f(z) = a n z" : 
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on peut espérer que, si l’on approchefpar 
des fractions rationnelles au voisinage de 0, 



alors les pôles de R /; vont approcher les 
pôles de/. Plus précisément, on calcule les 
coefficients A„ et ji,, en résolvant le système 
linéaire obtenu en identifiant les dévelop- 
pements limités d’ordre IV/ -f- N„ defet 
de R p à l’origine et on écrit alors R /; sous 
forme de fraction continue. Cette méthode 
est souvent utilisée de manière expérimen- 
tale dans les applications et donne des 
résultats fiables. 

Méthodes de projection 

Les méthodes de projection peuvent être 
décrites par le schéma général suivant. On 
considère un espace E de fonctions, normé 
par exemple, et une suite croissante de 
sous-espaces vectoriels fermés E„ dont la 
réunion soit dense dans E. Pour chaque 
entier n, on se donne un projecteur continu 
u n de E sur E„. On essaie alors d’approcher 
un élément / de E par la suite f n = u n (f). 

Le cas des projecteurs orthogonaux est 
un exemple fondamental : l’espace vecto- 
riel E est hilbertien, muni d’une base 
hilbertienne (e 0 , ?\ e,,, . E„ est le 

sous-espace engendré par (e, e,,) et u n 

est le projecteur orthogonal de E sur E„. 
Dans ces conditions, f n converge toujours 
vers / (cf. espace de HILBERT) . Le cas des 
séries de Fourier est celui où E est l’espace 
vectoriel des fonctions 1-périodiques de 
carré intégrable sur [0, 1] muni de la norme 
quadratique et où, pour tout n , 
e,, (t) = zxp 2 mnt (cf. séries trigonomé- 
triques ) . De même, lorsque E est l’espace 
vectoriel L 2 ([— 1, 1]) et que e n est le 
polynôme de Legendre L„ de degré /?, on 
obtient ainsi un procédé canonique 


d’approximation en moyenne quadratique 
de f par des polynômes U n (f). Le cas plus 
général des développements en série de 
fonctions orthogonales entre dans ce cadre 
(cf. polynômes ORTHOGONAUX), ainsi que 
la méthode de Galerkine. 

Ces résultats montrent tout l’intérêt des 
normes quadratiques N 2 sur les espaces de 
fonctions ; en effet, nous verrons au cha- 
pitre 8 que, pour ce type de problème, le 
comportement de la norme est beau- 
coup moins agréable. 

Emploi d’extremums 

De nombreuses questions d’analyse fonc- 
tionnelle peuvent se ramener à la recher- 
che d’extremums (problèmes variation- 
nels, problèmes aux limites dans les 
équations aux dérivées partielles...) que 
l’on peut souvent schématiser de la façon 
suivante. Soit C une partie convexe d’un 
espace hilbertien E et x un élément de E. 
Il existe alors au plus un point z de C 
tel que d(x, z) — d(x, C). Pour étudier 
l’existence de z et approcher ce point, 
on construit une suite (z, ? ) d’éléments 
de C telle que lim d(x> z n ) = d(x, C). On 

n — f 05 

montre que cette suite est une suite de 
Cauchy. La convergence de la suite ( Z n ) est 
alors assurée lorsque C est une partie 
fermée de E. 


5 . Interpolation et discrétisation 
Position du problème 

Ce sont les problèmes de tabulation numé- 
rique des fonctions transcendantes élémen- 
taires (lignes trigonométriques, logarith- 
mes) et, à partir du XVII e siècle, le calcul 
approché des intégrales et des dérivées qui 
ont été à l’origine du développement des 
méthodes interpolatoires. D’autre part, 
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dans de nombreux phénomènes continus 
intervenant en sciences physiques, décrits 
par exemple à l’aide d’une fonction, on ne 
connaît les valeurs de cette fonction qu’en 
un certain nombre de points qui corres- 
pondent aux mesures effectuées. Les pro- 
blèmes issus de l’astronomie, en particulier 
la détermination de la trajectoire des 
planètes, ont aussi joué un rôle moteur, 
comme en témoignent notamment les tra- 
vaux d’Euler, Lagrange, Legendre, 
Laplace et Gauss. 

Dans tous les cas, le phénomène 
continu est remplacé par un phénomène 
discret. Plus précisément, supposons que 
le phénomène continu est décrit par une 
fonction numériquefd’une variable réelle. 
On se donne une subdivision S de l’inter- 
valle [a, 0], c’est-à-dire une suite croissante 
(a 0 , CXj,.... a n ) de points de [a, P] ; le 
module de la subdivision S est le nombre : 

A(S) = sup (cq +1 — cq). 

1 

Lorsque a 0 = a, (J n = p et, pour tout 
y, a y+1 — a y - = (P — a )/«, on dit que la 
subdivision est à pas constant, et 
A(S) = (P a )/n s’appelle le pas de S. 

Dans ces conditions, on associe à S la 
suite finie (/ (a 0 ), .... f(a n )). Nous dirons 
qu’il s’agit d’une discrétisation de f Le 
problème est alors de savoir dans quelle 
mesure on peut reconstituer f à partir des 
phénomènes discrétisés associés. A cet 
effet, on interpole la suite précédente par 
une fonction simple, par exemple une 
fonction polynomiale que nous noterons 
P s (f), de degré ^ n , prenant aux points a y 
les mêmes valeurs que f . Dans le cas où S 
est à pas constant, cette méthode a été 
élaborée dès le XVII e siècle, notamment par 
Newton et Gregory, dans le cadre du calcul 
des différences finies (cf. infra). L’étude 
du cas général a été ébauchée par 


Newton et reprise par Lagrange, Cauchy 
et Hermite. 

Il s’agit alors d’estimer la différence 
f “ Ps(/*), par exemple en majorant 
Njc (f — P s (/)), et d’étudier l’influence de la 
taille de l’intervalle [a, [3], du choix de S et 
de la régularité de f sur la qualité de 
l’approximation. 11 arrive souvent qu’on ne 
s’intéresse pas directement à f mais à la 
valeur d’une forme linéaire sur/. Pour ce 
type de problème, d’autres normes s’impo- 
sent : norme N, pour les intégrales, normes 
/*— ► No c (f) + Noc(D f) pour les dérivées. 
Dans les phénomènes physiques, les nor- 
mes N 2 interviennent souvent au titre de 
l’énergie. 

On peut aussi se demander s’il est 
possible de reconstituerfcomme limite de 
fonctions P s (/) en raffinant les subdivi- 
sions, c’est-à-dire en faisant tendre le 
module A(S) vers 0. Mais cette question 
présente des difficultés (cf. infra , Interpo- 
lation polynomiale). C’est pourquoi on a 
recours à un procédé plus élaboré : on se 
donnefsur un intervalle [ a , b], on découpe 
cet intervalle en p intervalles de longueur 
(b — a)jp et, sur chacun de ces intervalles 
notés [a, P], on approche / par P s (f). Le 
problème est alors de savoir comment on 
peut jouer sur les entiers n etp pour obtenir 
des approximations efficaces. Dans ce 
schéma plus élaboré, f est approchée sur 
[a, b] par une fonction (p continue et 
polynomiale par morceaux. On peut impo- 
ser en outre à cp des conditions de régu- 
larité plus fortes aux p — 1 points de 
subdivision de [ a , 6], ce qui conduit par 
exemple à la théorie des fonctions spline 
(cf. infra , Interpolation polynomiale par 
morceaux). Les méthodes de discrétisation 
s’appliquent aussi à la recherche de solu- 
tions approchées d’équations différentiel- 
les, grâce à l’emploi d’équations aux 
différences finies (cf. équations DIFFÉREN- 
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TIELLES, chap. 7) ; plus récemment, le 
développement des calculs sur ordinateurs 
a permis de les appliquer avec succès aux 
équations aux dérivées partielles. 

Nous commencerons par décrire les 
principales méthodes d’interpolation poly- 
nomiale et nous aborderons ensuite l’inter- 
polation par les fonctions polynomiales 
par morceaux. 


Les solutions de (1) sont alors les polynô- 
mes P de la forme P „ P h + QN, où 

Q G C[X]. 

En particulier, pour tout i, il existe un 
polynôme L, de E„ et un seul tel que : 

L/(a,-) = 0 s i i¥^j 

(3) ” 

1 L,(a,) = 1, 

à savoir le polynôme : 


interpolation polynomiale 


(4) 


L, : 


n 


7*7 «/-«y 


Interpolation de Lagrange 
Etant donné un élément b = ((3 0 , . . . . (3„) 
G C" +1 , on veut étudier les polynômes P à 
coefficients complexes tels que, pour toutj, 


Dans ces conditions, on a : 

n 

(5) P» = £ Pi L/. 

frb 


(1) P («y) = Py 

A cet effet, on introduit l’application 
linéaire u : C[X] — ► C' 7+1 qui à tout poly- 
nôme P associe (P(a 0 ), .... P(cc,,)). Les 
équations (1) s’écrivent alors sous la 
forme : 

(V) u(P) = b. 

Le noyau de u est constitué des poly- 
nômes P qui s’annulent en tout point a /5 
c’est-à-dire qui sont divisibles par : 
n 

(2) N = JJ (X _ a,). 

j = 0 

Ce polynôme N. dont la donnée équi- 
vaut à celle du système S, joue un rôle 
fondamental dans la théorie de l’interpo- 
lation ; on l’appelle le noyau interpola teur 
associé à S. Le théorème de division 
euclidienne des polynômes montre que 
C[X] = Ker u ® E„, où E„ est l’espace 
vectoriel des polynômes de degré ^ n . 

L’application linéaire U induit un iso- 
morphisme de E„ sur C" + l . Ainsi, il existe 
un polynôme de degré ^ n et un 
seul tel que, pour tout /, on ait P/, (00 = P ; . 


Soit maintenantf’une fonction continue 
à valeurs complexes sur [a, (3], et 

b = (/(a 0 ), .... /(a,,)) ; le polynôme P,, 
s’appelle le polynôme d ' interpolation de 
Lagrange de /associé à S et se note L s (/) 
(fig. 4). Ainsi. L s (/) est l’unique polynôme 
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de degré inférieur à n tel que, pour 
tout j, 

(6) Ls (/■)(<*;) =/(«;), 

et : 

n 

(7) i s (f) = )L,. 

En outre, l’application U§ : L s (/) 

est un projecteur de C([æ, b]) sur le 
sous-espace vectoriel E„. 

On peut estimer la précision de 
l’approximation de / par L s (/), grâce au 
théorème de division des fonctions diffé- 
rentiables (cf. supra) ; on démontre que, si 
fest de classe C w+1 sur [a, p], alors, pour 
tout t G [a, p], on a la majoration : 

(8> W)-y«)K|J|M, tI (/), 

et, en particulier : 

(9) II/- L S (/)L < M, + , (/). 

Ces majorations ne peuvent pas être 
améliorées, car (8) et (9) sont des égalités 
lorsquefest le noyau interpolateur N. 

Supposons maintenant que f est de 
classe C 00 ; donnons-nous une suite (S„) de 
subdivisions telle que A(S,) — ► 0 et notons 
plus simplement L n (f) le polynôme inter- 
polateur de / associé à S„. Dans ces 
conditions : 

(9-) 11/- L„ (/)L < y+ij fM.-nCA 

où N, J+1 est le noyau interpolateur associé 
à S,„ qui est de degré n 1. 

Pour étudier la convergence de L,(f) 
vers /, on observe que : 

Il N„ + j II ■ < (P — a) n + 1 ; 

mais M n+l (f) peut croître très vite, si bien 


que la majoration (9’) ne permet de 
prouver la convergence que sifest holo- 
morphe dans un disque ouvert contenant 
l’intervalle [a, P]. D’ailleurs, dans le cas 
des subdivisions à pas constant (p — 0()/«, 
il peut arriver, contrairement à toute 
attente, que f soit analytique sur R mais 
que L„(f) ne converge pas vers f sur [(X, P], 
C’est le cas par exemple si [a, p] — [— 1, 
-I- 1], f(t) = 1/(1 + a 2 ! 2 ) (fig. 5) et a 



assez grand, par exemple a ^ 2. On obser- 
vera qu’ici if a et — ija sont des pôles de 
f (z) = 1/(1 -b û 2 z 2 ), si bien que la condi- 
tion d’holomorphie évoquée ci-dessus n’est 
pas réalisée. Ce type de phénomène a été 
découvert par Runge et Borel. 
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Pour remédier à ce défaut, on peut 
essayer de choisir les subdivisions S„ de 
telle sorte que ||N„_(_j ||* soit minimale, ce 
qui a lieu lorsque N„ est le n-ième poly- 
nôme T,, de Tchebychev. Pour [a, [3] = 
[- 1, + 1], on a : 

(10) T„ (cos 0) = cos (« 0), 

auquel cas : 



et les points a y sont : 

a, = CO^ (2j + 1) ^ [, 0 < j < n — 1 



projections sur [- 1, + 1] des sommets du 
polygone régulier à 2 fl côtés. Ces points 
s’accumulent donc aux deux extrémités de 
l’intervalle [— 1, + 1], Nous verrons au 
chapitre 7, en utilisant une estimation 
beaucoup plus fine que (9'), que la conver- 
gence de L n (j) vers /est alors assurée sous 
des conditions très larges, par exemple si 
f est de classe C 1 . 

Cependant, cette convergence n’a pas 
lieu pour toutes les fonctions continues. En 
effet, d’après un théorème de Faber, quelle 
que soit la suite (S„), il existe une fonction 
continue f telle que | L n (f) |[x tende vers 


+ oo. Ce résultat est un des exemples cités 
par Banach et Steinhaus comme étant à 
l’origine du théorème qui porte leur nom 
(cf. espaces vectoriels normés, chap. 4). 

Interpolation de Hermite 
Il s’agit du cas plus général où l’on impose 
au polynôme interpolateur des contacts 
d’ordre donné avec la fonction f aux 
points a r On se donne cette fois une suite 
(a 0 , .... a r ) de points de [a, (3], et une suite 
(ft 0 , n r ) d’entiers strictement positifs. On 
pose : 



et : 

n = n (x - «/)"' 

J = 0 

Lorsque /est de classe C" +1 sur [«, PL 
il existe un polynôme L s (/) de degré ^ n 
et un seul tel que, pour tout y, 0 oo. 
et tout k, 0 ^ k ^ lïj— 1, on ait : 

(11) D'L^Xa,) = D*/(a,) 

En outre, pour tout t £ [a, [3], 

(121 \f(t ) — L s (f)(t ) | < + 

Le polynôme L s (/) est le polynôme 
d’interpolation de Hermite associé à S. Le 
cas de Lagrange correspond à rij = 1. 
tandis que la formule de Taylor corres- 
pond à/’=letHo=W + 1’ c’est-à-dire : 

N(0 = (t-a)“+\ 
et : 

l s ( m ) = T a c n 

(cf. supra , chap. 3). 

Dans le cas où «y = 2, c’est-à-dire : 

r 

N = jq (X — aj) 1 , 
j = 1 
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on impose à L s (/) d’avoir un contact à 
l’ordre l en chaque point interpolateur a,. 
Ce cas intervient notamment dans les 
méthodes d’optimisation pour le calcul 
approché des intégrales. La positivité du 
noyau N joue un rôle essentiel dans ce 
genre de question. 


Différences divisées 

L’expression du polynôme interpolatoire 
de Lagrange (formule (7)) a l’avantage de 
faire intervenir de manière symétrique les 
points de subdivision, mais elle est mal 
adaptée au calcul numérique, d’autant plus 
que l’adjonction de points interpolateurs 
supplémentaires oblige à recommencer 
entièrement les calculs. Newton avait pro- 
cédé en utilisant une autre base de l’espace 
vectoriel des polynômes de degré ^ n, à 
savoir D 0 = 1 , D, = X oc 0 , D 2 = 
(X a 0 )(X a,), • • • • D„ = (X - a„) ... 
(X a„ i) ; ici la matrice de passage 
de la base canonique 1, X, X ,f à 
cette base est beaucoup plus simple que 
dans le cas de Lagrange car elle est 
triangulaire. 

Pour obtenir la décomposition dans 
cette base du polynôme interpolateur 
L s </), on introduit les différences divisées 
defrelatives à S, définies par les relations 
de récurrence : 


En outre, le reste est donné par la 
relation : 


(14) f{t ) _ L s (/■)(/ ) = N (/ )ï n + , {U a 0 , . ..> a,). 


L’adjonction à S d’un point supplémen- 
taire ne modifie pas les différences divisées 
précédentes. En outre, la différence divisée 
& ! est une fonction symétrique de a 0 , 
a- r car : 


3ÿ(«o>. • • - a j 


) = 


In 


/(«*> 

(a* — a*) 


Subdivisions à pas constant 

Lorsque S est une subdivision de [a, (3] à 
pas constant h = ((3 a)/tf, il est com- 
mode d’étudier d’abord le cas où h = 1 et 
a = 0, et donc (3 = n 1 ; le noyau inter- 
polateur s’écrit alors : 

(15) N _ X(X-l)... (X — » + 1). 

Pour calculer le polynôme interpolateur 
L s (g), où g est définie sur [O. n 1], ° n 
introduit l’opérateur de Bernoulli A, à 
savoir l’endomorphisme de C[X] défini par 
la relation : 

(16) AP(X) = P(X + 1) -P(X). 

L’étude de cet endomorphisme conduit 
à introduire une base de C[X] adaptée à A, 
définie par les relations de récurrence : 


^o( a o) =/( a o). 

y, (a, a,) ,/(«. »> -/(«■> , 
a 0 — aj 

_ ^ j — l( a 0 i Oj — l) ^ j— l( a l > 

«0 — a j 


Dans ces conditions, on a la for- 
mule : 


(13) 



i = o 


a,)D,. 


(17) 


N 0 = 1 
AN, = N p _ 1 , 


N,(0) =0, p > 1. 


Ces polynômes sont donnés par les 
relations : 


(18) n 0=1 ,n ; = x,n 2= ^,... 

NT X(X — 1) ... (X — p + 1) 

' 7 ! 

Les polynômes s’appellent polynô- 
mes de Newton ; on remarquera que 
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N /? = (\jp !) D /r Dans ces conditions, 
tout polynôme P se décompose sous la 
forme : 

K 

(19) P= ^(A>P)(0)N,; 

p = 0 

c’est la formule de Newton-Gregory, 
analogue à la formule de Taylor qui est, 
elle, relative à l’opérateur de dérivation D, 
la base adaptée étant alors 1, X, ... . 

1 /(/H) 

Appliquant la relation (19) à L,(g), on 
obtient : 

n 

(20) L&) = ^(A^)(0)N p . 

p- 0 

Le calcul des différences successives 
dites non divisées (A^)(0) est très facile. Le 
cas d’une fonctionfdéfinie sur [a, p] se 
ramène au cas précédent par changement 
de variable affine, en introduisant g(u) 

=f(a + (P - a)u). 

On peut développer une théorie entiè- 
rement analogue en introduisant à côté de 
l’opérateur de Bernoulli progressif A, l’opé- 
rateur régressif V défini par : 

(21) VP(X) = P(X) — P(X — 1) 
et l’opérateur symétrique : 

(22) 6P(X) = P(X + I)-P(X-i). 

Les opérateurs A, V et 5 peuvent 
s’exprimer à l’aide des opérateurs de 
translation : 

(23) T a P(X)= P (X-h) 
par les formules 

( 24 ) A = T_ 1 -I, V=I-T„ 6 = T_i-Ti; 

2 2 

on peut alors développer un calcul 
symbolique sur ces opérateurs et l’opéra- 


teur de dérivation D. Ainsi, la formule de 
Taylor traduit la formule symbolique 
T/, = exp/zD. Ce calcul, ébauché par Lei- 
bniz, a été systématisé par Lagrange et 
Laplace ; à la fin du XIX e siècle, il a été 
repris dans le cadre général de la théorie 
des opérateurs de convolution, c’est-à-dire 
des opérateurs qui commutent aux trans- 
lations. 

Généralisations 

Le problème de l’interpolation se pose 
aussi pour les fonctions périodiques, 
auquel cas les fonctions polynomiales 
sont remplacées par des polynômes 
trigonométriques. Ces deux exemples se 
placent dans la théorie générale des sys- 
tèmes de Tchehychev : on se donne un 
sous-espace E„ de dimension n + 1 de 
l’espace C([a, |3]) qui est régulier, c’est-à- 
dire tel que tout élément de E„ qui s’annule 
en au moins n + 1 points est nul. Étant 
donné une base cp 0 , cpj, . . . . (p w de E„, 
on interpole f par une combinaison 
linéaire de ces fonctions. On peut montrer, 
en particulier, que l’espace vectoriel des 
solutions d’une équation différentielle 
linéaire sans second membre d’ordre 
n -\~ 1 est régulier. 

Interpolation polynomiale 
par morceaux 

Théorie classique 

On considère cette fois une fonction / 
continue sur un intervalle [a, b\ que l’on 
découpe en p intervalles If tj+ 1] de lon- 
gueur (b— a)jp et, sur chacun de ces 
intervalles, on effectue une interpolation 
de Lagrange ou de Hermite de /’ par des 
polynômes de degré n. En pratique, fl 
est fixé et assez petit pour éviter les 
phénomènes du type de Runge. Il s’agit 
alors d’étudier la convergence de la suite 
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((fy) des fonctions polynomiales par mor- 
ceaux ainsi obtenues vers la fonction f et 
la rapidité de convergence en fonction de 
la régularité de f 

Voici les deux exemples les plus impor- 
tants. 

1. Fonctions en escalier. Sur chaque 
intervalle [tp f /+1 ], on approche f par une 
constante, par exemple f (tj) ; ici fl = 0. 
Grâce à la continuité uniforme de f sur 
[a, b] 9 on montre aussitôt que les fonctions 
en escalier ainsi obtenues convergent uni- 
formément vers f sur [a, h]. 

En outre, si f est lipschitzienne sur 
[a, b], alors : 

(25) 

où \(f ) désigne le rapport de Lipschitz de 
/, l’égalité étant atteinte si f est affine. 

2. Fonctions affines par morceaux. Sur 

chaque intervalle [tp tj+ J, on effectue une 
interpolation linéaire de f On montre 
encore que les fonctions affines par mor- 
ceaux (fy ainsi obtenues convergent uni- 
formément vers f sur [a, h]. En outre, si f 
est lipschitzienne de rapport k sur [a, b], on 
a : 

(26) N 

l’égalité étant atteinte par exemple pour 
[a, b] — [— 1, 1] et f(x) = x |. 

Mais, cette fois, si f est de classe C 1 , la 
rapidité de convergence est meilleure. Par 
exemple, si f est lipschitzienne, 

(27) N„(/ — <p p ) < ^=f^Â</'), 

l’égalité étant atteinte par exemple si 
[a, b] = [- 1, 1] et f(x) = x 2 . 

Dans certains problèmes, comme le 
calcul approché des intégrales, on est 
amené à interpoler f par des fonctions 


polynomiales par morceaux de degré n 
plus élevé. Lorsque f est de classe C' J+ 1 , on 
a alors : 

( 28 ) N.y-^X ^-^. M.,^). 

On constate ainsi que la rapidité de 
convergence est gouvernée par la régula- 
rité de f. 

Fonctions spline 

Lorsque fl ^ 2, le procédé précédent pré- 
sente de nombreux inconvénients, car on 
approche des fonctions régulières f par des 
fonctions qui ne sont même pas de classe 
C 1 . Il est donc intéressant d’approcher f 
par des fonctions cp satisfaisant aux deux 
conditions suivantes : 

a) Sur chaque intervalle [t p la 

fonction (p est polynomiale de degré n ; 

b) Sur [a, b], la fonction cp est de classe 
C" 1 (conditions de recollement aux 
points tj). 

De telles fonctions sont appelées spline 
(tringle souple). L’espace vectoriel 
S n ([a , h]) de ces fonctions est de dimension 
n -f- p. Si on impose maintenant les p + 1 
conditions interpolatoires relatives à la 
fonction f : 

c) Pour tout y, 0 ^ y ^ p, on a l’égalité 
ip(lj) = f (tj), et il reste fl 1 paramètres 
encore libres. 

Le cas n = 2 (fonctions paraboliques 
par morceaux) ne conduit pas à une 
théorie intéressante car il ne reste qu’un 
seul paramètre, ce qui ne permet pas 
d’imposer une condition de contact aux 
deux extrémités de l’intervalle [a, b]. Au 
contraire, le cas fl = 3 (fonctions spline 
cubiques) convient bien car il permet 
d’imposer la condition : 

d) cp'(tf) = f'(d) et <p’(b) = / ‘(h)- 

Les fonctions spline cubiques convien- 
nent aussi pour l’interpolation des fonc- 
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dons périodiques. Dans ce cas, on impose 
à (p de se prolonger en une fonction 
périodique de classe C 2 sur R, ce qui 
conduit à remplacer la condition (d) par : 

d) D + cp(a) = D_cp(6) et D^cp(a) = 
Dlcp(£), en désignant par et D_ les 
opérateurs de dérivation à droite et à 
gauche. 

On démontre que les conditions (a), (b), 
(c), ( d) ou ( d ), déterminent cp de manière 
unique. Cette fonction se note S^XO et 
s’appelle fonction spline cubique interpo- 
lant f à l’ordre p . Il faut cependant 
remarquer que le calcul explicite de (p 
nécessite la résolution d’un système 
d’équations linéaires assez compliqué. En 
revanche, la qualité de l’approximation est 
excellente : 

si f est de classe C 1 , on a : 

N.(/--S,(/-)) = o(i); 

- si f est de classe C 2 : 

N«(/- S, (O) =<>(!) 
et, en outre : 

n„</'-s;(/))= o(t), 

ce qui signifie qu’il y a aussi convergence 

uniforme pour la dérivée ; 

si f est de classe C 3 , alors, pour k 2 : 

N4D‘/-D‘S,(/))=o(^y ; 

enfin, si f est de classe C 4 , alors, pour 

3 : 

Cependant, si f est de classe C°°, ou 
même polynomiale de degré ^ 4, on ne 
peut pas améliorer la dernière estimation. 


Un autre pôle d’intérêt des fonctions 
spline est relatif à leurs propriétés pour la 
norme quadratique. Plus précisément, si f 
est de classe C 2 , pour tout élément (p de 

S 2j ,([a, b]), on a : 

JV-?T< JV-s;(/->p 

+ Jj s ^’ (/) — 9" 1 2 ; 

en particulier, parmi toutes les fonctions 
spline cubiques cp, c’est S p {j ) qui approche 
le mieux f pour la norme de l’énergie. 
Cette propriété est à l’origine de la 
dénomination spline, car on peut montrer, 
grâce au principe de moindre action, que 
S (f) réalise la position d’équilibre d’une 
tringle souple passant par les points 
interpolateurs et tangente à des droites 
données aux extrémités de l’intervalle. Ce 
procédé est depuis longtemps utilisé en 
dessin industriel. Les fonctions spline 
se sont révélées très utiles dans les pro- 
blèmes de conception assistée par ordina- 
teur. 

La théorie des fonctions spline peut se 
généraliser aux spline d’ordre impair quel- 
conque. Les propriétés d’approximation 
sont alors meilleures mais les calculs sont 
encore plus complexes que pour n = 3, si 
bien qu’elles sont peu utilisées en analyse 
numérique. 

6. Opérations sur les représenta- 
tions et les approximations 

Nous avons déjà vu que l’emploi des 
représentations pour la résolution des pro- 
blèmes nécessite de pouvoir opérer sur ces 
représentations : il s’agit non seulement 
des opérations algébriques (somme, pro- 
duit...) mais aussi des opérations de pas- 
sage à la limite (limites de suites, sommes 
de séries, intégration, dérivation). Ces 
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problèmes rentrent dans le schéma général 
d’interversions de passages à la limite. 
Nous commencerons par préciser les pro- 
priétés stables par passage à la limite 
uniforme pour les suites de fonctions, ce 
qui est étroitement lié au cas des séries, 
puis nous examinerons le cas des repré- 
sentations intégrales. Nous terminerons 
par quelques indications sur les autres 
modes de convergence. 

Suites de fonctions 

Les trois problèmes les plus importants 
sont les suivants. 

Problème 1. Continuité et passage à la 
limite. Soit (f n ) une suite de fonctions 
continues sur un espace métrique A à 
valeurs complexes, convergeant sur A vers 
une fonction f. La fonction f est-elle 
continue sur A? 

La réponse est négative pour la conver- 
gence simple, comme le montre l’exemple 
A = [O. 1 ] et f (x) = X”. 

Théorème 1 . Stabilité de la continuité. Si 
( f n ) converge uniformément versfsur tout 
compact de A, alors f est continue sur A. 

Problème 2. Passage à lu limite dans les 
intégrales. On dispose de deux résultats 
très importants. Le premier est élémen- 
taire. 

Théorème 2. Passage à la limite dans les 
intégrales (cas compact). 

Soit (J n ) une suite d’applications conti- 
nues de [a, b] dans C qui converge 
uniformément vers / sur [a, h]. Alors : 

f* lim/„ = lim f7„ 

Oa n » il i 

(interversion des signes lim et J). 

Ce résultat s’étend si on remplace le 
segment [a, b] par une partie compacte de 
R"\ 


Le second résultat a une portée beau- 
coup plus générale ; il se place dans le 
cadre de la théorie de l’intégrale de Lebes- 

gue (Cf. INTÉGRATION ET MESURE). 

Théorème 2 bis (théorème de convergence 
dominée). Soit (j' n ) une suite de fonctions à 
valeurs complexes intégrables sur 1 et qui 
converge simplement vers f sur 1 . On 
suppose qu’il existe une fonction ip ^ 0, 
intégrable sur 1, telle que l’on ait : 

\f„ | < <p. 

Alors / est intégrable et on a : 

f lim/„ = lim f/„. 

Jl n n Jl 

Ce résultat s’étend sans changement au 
cas où I est une partie localement com- 
pacte de R'”. 

Problème 3. Passage à la limite dans les 
dérivées. Soit (f n ) une suite de fonctions de 
classe C 1 sur un intervalle 1 de R, à valeurs 
complexes, convergeant vers f sur 1. La 
fonction / est-elle de classe C 1 sur I et a-t-on 

D/=limD/ ff ? 

L’exemple de I = [0, 1] et f„(x) = 
(sin nx)jn montre que la convergence uni- 
forme ne suffit pas. 11 faut donc faire des 
hypothèses sur la suite (D/J,). 

Théorème 3. Passage à lu limite dans les 
dérivées. On fait les hypothèses suivantes 
sur la suite (f n ) : 

a) f n converge vers/uniformément sur 
tout compact de I ; 

b) f n converge vers g uniformément 
sur tout compact de I. 

Alors f est de classe C 1 sur I et f ' = g, 

autrement dit : 

D(lim/„ ) = lim D /„ 

n n 

Ce théorème s’étend aussitôt aux 
fonctions de classe C p et C°° et au cas 
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des fonctions définies sur un ouvert U 
de R'". 

On notera que, en revanche, dans le cas 
des fonctions analytiques d’une variable 
complexe, la convergence uniforme sur 
tout compact de f n versf entraîne celle de 
P/n vers D/ (théorème de Weierstrass, cf. 

fonctions analytiques -Fonctions analy- 

tiques d’une variable complexe, chap. 5). 


Théorème I. Continuité de lu somme. Si, 
pour tout n , la fonction u„ est continue sur 
A et si la série converge uniformément sur 
tout compact de A vers f alors / est 
continue sur A. 

Théorème 2. Intégration terme à terme sur 
un intervalle compact. Supposons que, 
pour tout n , la fonction u n est continue sur 
[a, b] et que la série converge uniformé- 
ment sur [a, h]. Alors : 


Séries de fonctions 

On se donne une série Cu„ de fonctions 
définies sur un espace métrique A et à 
valeurs complexes. 

On dit que cette série converge simple- 
ment (resp. uniformément) vers une fonc- 
tion f si la suite des sommes partielles 


z-zr- 


Théorème 2 bis. Intégration terme à terme 
dans le cas non compact. Soit (u,) une suite 
de fonctions à valeurs complexes, intégra- 
bles sur I. On suppose : 



n = 0 


converge simplement (resp. uniformé- 
ment) vers f. 

Pour vérifier que la série converge 
uniformément, on utilise souvent la 
méthode des séries numériques majoran- 
tes. On dit qu’une série numérique (3 tt , 
(3 /? 0, est une série mujorante sur A de la 

série de fonctions TjU n si, pour tout n et 
pour / E A, on a: 

|«»( f )| < P B - 

Si la série majorante converge, la conver- 
gence de la série Ym u est uniforme sur A. 
Dans ces conditions : 


ZI 1 - 1 — 

n = 0 

Alors la série Ew /; (f ) converge sur I pour 
presque tout t, sa somme est intégrable sur 
1 et on a : 


z- Zi- 


Théorème 3. Dérivation terme à terme. 
Supposons u n de classe C 1 sur I et suppo- 
sons que les séries Qj, et ZD u n convergent 
uniformément sur tout compact de I. Alors 
Z (j u n est de classe C 1 et on a : 


D 



z 

n = 0 


Du n . 


^ Il g, IL < +°°; 

n = 0 

une telle série est dite normalement conver- 
gente sur A. 

En appliquant les théorèmes sur les 
suites, on obtient les résultats suivants. 


Fonctions définies par des intégrales 

On se donne une fonction (x, t ) •— * f (x, t ) 
définie sur A X I, à valeurs complexes, où 
A est un espace métrique et I un intervalle 
de R (ou, plus généralement, une partie 
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localement compacte de R m ). On veut 
alors étudier la fonction : 

x-F(x) =^f{x,t)dt. 

On dispose alors des trois résultats 
suivants, dont le premier est élémentaire. 

Théorème 1. Dérivation sous le signe somme 
(cas des intervalles compacts ). On suppose 
que A est un intervalle de R et I = [a, h] 
un intervalle compact. Alors : 

a) sifest continue sur A X [a, h], F est 
continue sur A : 

h) si /admet une dérivée partielle Ôf/ÔX 
continue sur A X [ a , h], alors F est de 
classe C 1 sur A et : 

Ce théorème a été utilisé par Leibniz. 

Théorème 2. Dérivation sous le signe somme 
(Leibn iz-Lebesgue) . Soit A et 1 des inter- 
valles de R. On fait les hypothèses suivan- 
tes : 

a) pour tout t l’application x * /(.Y, t ) 
est continue sur A ; 

b) pour tout x G A, l’application 
t >— ► / (.Y, t ) est intégrable sur I ; 

f) pour tout compact K de A, il existe 
(p K > 0, intégrable sur 1, telle que : 

WG I, VxGK, |/(x,0K<Pk(0 

Alors f est continue sur A. 

Si, de plus, on a : 

d) f admet une dérivée partielle df/ôx 
continue par rapport à x et satisfait à une 
hypothèse de domination sur tout com- 
pact K de A, 

alors F est de classe C 1 sur A et on a : 
df(x) = 


Le problème de l’intégration de F se place 
dans le cadre plus général de la théorie des 
intégrales sur un espace produit, où on 
dispose du théorème suivant, qui permet le 
calcul d’une telle intégrale par intégrations 
successives. 

Théorème de Fubini. 

1. Soit (.Y, y) •— / (.Y, y) une fonction 
mesurable positive définie sur R'” X RL 
Alors, il est équivalent de dire : 

a) f est intégrable sur R m X R /; ; 

b) pour presque tout .v, la fonction 
y i— ► //y, y) est intégrable sur R/ 7 et la 
fonction : 

f f(*>y)dy 

tJ R f 

est intégrable sur R'" ; 

h’) condition analogue à (6) en échan- 
geant x et y . 

Dans ces conditions, on a alors : 
ff f(x,y)dxdy = f f f f(x,y)dy\dx 

J Jr* X R ,P Jr* j 

=l\L f(x ’ y)d ^ dy - 

2. Si / est à. valeurs complexes, (a) 
entraîne (b) et (h’) et on a la formule de 
calcul de l’intégrale double ; mais ici les 
conditions ( a ), (h) et (b') ne sont plus 
équivalentes, comme le montrent des 
exemples classiques. 

Emploi des distributions 

Les théorèmes précédents sont satisfai- 
sants en ce qui concerne la continuité 
et l’intégration mais le sont beaucoup 
moins en ce qui concerne la dérivation. 
Cela tient au fait que, dans les espaces 
classiques de fonctions, l’opérateur D de 
dérivation n’est pas continu. Un des avan- 
tages principaux de la théorie des distri- 
butions est précisément de fournir un 
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cadre théorique dans lequel la dérivation 
est une opération régulière au sens sui- 
vant : toute distribution T est indéfiniment 
dérivable et si une suite (T,) de distribu- 
tions converge vers T, alors (DT,,) 
converge vers T (cf. distributions) . 

Le seul inconvénient est que la conver- 
gence des distributions ne peut pas être 
décrite par une norme. C’est pourquoi 
on introduit les espaces de Sobolev : ce 
sont des sous-espaces de 3)' qui pré- 
sentent les mêmes avantages que T)' 
mais qui, en outre, sont des espaces 
hilbertiens et sont bien adaptés à l’emploi 
de la transformation de Fourier et à 
l’étude des problèmes aux limites des 
équations aux dérivées partielles (cf. équa- 
tions aux dÉrivÉes partielles - Théorie 
linéaire). 

Pour définir ces espaces, on considère 
l’espace vectoriel S'(R") des distributions 
tempérées sur ; on sait que la trans- 
formation de Fourier T * T est un auto- 
morphisme de S ' (cf . DISTRIBUTIONS , 

chap. 4). 

Pour tout s 6 R, on introduit le sous- 
espace vectoriel FF(R") des distributions 
tempérées T telles que : 

(1 \x | 2 ) i/2 T G L 2 (R"). 

Par l’isomorphisme T 1 — ► (1 + x | 2 )^ 2 T, 
on transporte à H’ la structure hilbertienne 
de L 2 , en posant : 

(1) (S|T) = J b< (1 +|x| z )*s£}t(*)<fr; 

l’opérateur de dérivation : 



est alors une application continue de FF 
dans H' ' q , où a = oij -f- + a,,. 

Lorsque s = 0, on a H°(R fl ) L 2 (R"). 
Plus généralement, pour s = P G N, 


W(R") n’est autre que l’espace des distri- 
butions T telles que D°T G L 2 (R W ) pour 
tout (J vérifiant (X p ; en outre, le 
produit scalaire (1) est alors équivalent au 
suivant : 

(2) ((s t)) = ^£ d'<S(OD“T(/ ) dt. 

i«| < P 

Si maintenant p = — S G N, H p (R n ) 
est constitué des distributions T de la 
forme : 

oc 

T = £ D «/«,, /„ e L 2 (R"). 

M 

En outre, on peut repasser de la théorie 
FF à la théorie classique C k grâce au 
théorème suivant. 

Théorème de Sobolev. Si k GiV et si 
S ^ (n/ 2) + k , alors N V (R") C C A (R") et, 
si f n — * 0 dans FF, alors D a f n — ► 0 unifor- 
mément sur tout compact de R" pour tout 
multi-indice 0( tel que (X ^ k. 

Soit enfin K un compact de R tt et FF K 
le sous-espace vectoriel fermé de FF cons- 
titué des distributions à support contenu 
dans K. On dispose alors du théorème de 
Rellich. 

Théorème de Rellich . Si s > t , alors 
FF k C FF k et, de toute suite bornée de FF, 
on peut extraire une sous-suite conver- 
gente dans H’. 

Une autre interprétation des espaces FF 
est fournie par le théorème suivant. 

Théorème. Soit s ^ 0 écrit sous la 
forme s — p -F a, où 0^0 < 1. Alors 
/ G FF(R") si et seulement si D G L 2 (R") 
pour a ^ p et : 


[D«/(*)-D«/(y)l 2 


si | a | = p et a > 0. 


Ce théorème permet notamment de 
prouver l’invariance de H' par difféomor- 
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phisme et de définir l’espace H’(E) pour 
toute sous-variété C x de dimension n. 

Dans la théorie des équations aux 
dérivées partielles, on a besoin des espaces 
de Sobolev relatifs à un ouvert U borné de 
R n dont la frontière X est une variété 
compacte de classe C*. On définit alors 
H’(Ü) comme l’ensemble des restrictions à 
U des éléments de H 5 (R"). 

Les résultats concernant EU et H /? 
s’étendent à ce cas ainsi que le théorème de 
Rellich, où K est remplacé par U. En 
outre, si s > 1/2, l’application /•— ►/y, 
définie sur ‘J) (R"), se prolonge de manière 
unique en une application linéaire conti- 
nue de H’(Ü) dans EE 1/2 (X), appelée trace 
sur X et notée T — * T| X . Ces notions 
permettent de poser les problèmes aux 
limites de la théorie des équations aux 
dérivées partielles dans le cadre de la 
théorie des distributions (cf. équations aux 
dÉrivÉes partielles Théorie linéaire). 


7. Stabilité et consistance 

On peut décrire les procédés linéaires 
d’approximation par le schéma général 
suivant : soit E et F des espaces vectoriels 
normés de fonctions, et u une application 
linéaire continue de E dans F. Un proces- 
sus linéaire d’approximation de u est une 
suite (u„) d’applications linéaires continues 
de E dans F telles que, pour tout élément 
/ de E. u n (f) converge vers u(f). 

Le cas le plus classique est celui où 
F = E et où u est l’application identique 
de E, c’est-à-dire où U n (f) converge vers / ; 
nous en avons fourni de nombreux exem- 
ples aux chapitres 4 et 5, les plus signifi- 
catifs étant ceux des séries de Fourier et de 
l’interpolation de Lagrange. Le cas où 
F = C, c’est-à-dire où u est une forme 
linéaire sur E est aussi très intéressant. 


Stabilité 

Un des problèmes les plus importants, 
surtout pour l’analyse numérique, 
concerne la stabilité du processus (u,,) : si 
l’on fait une petite erreur sur la fonction/ 
c’est-à-dire si on remplace / par une 
fonction g proche de / dans E, u„(g) 
converge-t-elle vers un élément proche de 
u(f ) ? La réponse est fournie par le résultat 
suivant. 

Théorème 1. Caractérisation des proces- 
sus stables. 

1. Si la suite (|| u n ||) des normes des 
applications linéaires u n est bornée par un 
nombre M indépendant de n , alors, pour 
tout couple (/, g) d’éléments de E : 

h n (g) — u(f)\\ < M ||g — / 1 + \ u n (J) — u {f ) || . 

2. Réciproquement, si (|| u fl |j) n’est pas 
bornée, alors, pour tout élément f de E, 
il existe une suite (g n ) d’éléments de E 
qui converge vers f et telle que 

Il U„{g n ) -u(f) Il ^ + 

C’est pourquoi, on dit que le processus 
(u,,) est stable dans le cas (1) et instable 
dans le cas (2). 

En fait, ce résultat n’est pertinent que si 
les espaces normés E et F sont complets, 
car, si E n’est pas complet, E est un 
sous-espace dense d’un espace normé 
plus gros, à savoir son complété E ; si bien 
que, en faisant une erreur sur /, on risque 
de passer à un élément g de E qui 
n’appartient pas à E. C’est le cas où, par 
exemple, E = C ([a, b]) muni de la norme 
de la convergence uniforme et si 
E = C p ([a, b]). D’où l’intérêt du résultat 
suivant. 

Théorème 1 \ Stabilité et passage à un 
sous-espace vectoriel dense. Soit E et F des 
espaces de Banach et E un sous-espace 
dense de E. On considère une suite (u n ) 
d’applications linéaires continues de E 
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dans F satisfaisant aux deux conditions 
suivantes : 

a) pour tout f de E, u n (f) —►£/(/*); 

b) la suite des normes (|| u n ||) est bornée 
par M. 

Alors u est linéaire continue sur E, 

| U || ^ M, et les applications u n et w se 
prolongent de manière unique en des 
applications linéaires continues de E dans 
F, qui satisfont aux conditions (a) et (b) sur 
E . Ainsi, le processus (wJ est stable, non 
seulement sur E mais sur E . 

Dans le cas où E est complet , il est tout 
à fait remarquable que la convergence 
implique la stabilité. 

Théorème 2 (stabilité et complétude ). 
Soit E et F des espaces de Banach, (u n ) 
une suite d’applications linéaires continues 
de E dans F telle que, pour tout A' de E, la 
suite (u n (x)) converge dans F vers u(x). 
Alors : 

a) il existe M tel que [ u n || ^ M ; 

b) U est linéaire continue ; 

c) U n — ► U uniformément sur tout com- 
pact de E. 

C’est le théorème de Banach-Steinhaus 
(cf. espaces vectoriels normés, chap. 4). 

Le cas des séries de Fourier est à cet 
égard exemplaire ; c’est d’ailleurs un des 
exemples qui a été historiquement à l’ori- 
gine du théorème général précédent. Ici E 
est l’espace vectoriel C(T) des fonctions 
continues 1-périodiques muni de la norme 
N* ; cet espace est complet ; u n est la forme 
linéaire qui, à tout élément / de C(T), 
associe la valeur de la somme partielle 
s n (f) de sa série de Fourier en un point 
donné x ; U n (f) n’est autre que D„ */ (x), 
où D„ est le noyau de Dirichlet 
On montre que : 

il*, il «i dj, 


Ainsi, | D„ |) n’est pas borné ; il existe donc 
des fonctions continues dont la série de 
Fourier diverge au point x. Cependant, la 
convergence uniforme de S n (f) vers f est 
assurée par exemple si f appartient au 
sous -ensemble dense des fonctions pério- 
diques de classe C 1 (cf. séries trigono- 
MÉTRIQUES). 

Comme nous l’avons déjà vu au chapi- 
tre 5, un phénomène analogue se produit 
pour les processus interpolatoires. 

En revanche, le processus d’approxi- 
mation par les sommes partielles S n (J) est 
stable sur (C(T), N 2 ), et même sur (L’(T), 
N 2 ) car ici S„ est un projecteur orthogonal 
et ||j w ||2 = 1. De même, si on prend les 
sommes de Fejer O n (f) = F n *j\ alors 
| CJ^ 11^ = 1, ce qui assure la stabilité sur 
(C(T), NJ. 

On observera que, dans ce dernier cas, 
le noyau est positif. Cette condition assure 
la stabilité de manière très générale. 

Théorème 3. Continuité des opérateurs 
linéaires positifs. Soit u un endomorphisme 
de l’espace vectoriel C(T), ou C([æ, h]), 
muni de la norme N x . On suppose u positif; 
c’est-à-dire u(f) ^ 0 pour tout f ^ 0. 
Alors u est continu ; plus précisément : 

N .(«V» < N.(«(1))N.V). 

Autrement dit, ||w|| ^ N 30 (w(l)). 

Si maintenant ( u n ) est une suite d’opé- 
rateurs linéaires positifs qui converge sim- 
plement vers un opérateur a, auquel cas u 
est positif, alors la condition de stabilité est 
satisfaite pour u n : 

I M, K sup N_(«„ (1)). 

n 

En outre, le théorème suivant assure la 
convergence du processus sous des hypo- 
thèses très faibles. 

Théorème 4 (théorème de Korovkine). 
Soit (u„) une suite d’endomorphismes posi- 


sin(2fl! + ljirf 


sm7rT 


dt - 


- In n. 
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tifs de h]) muni de la norme N* 

et u un endomorphisme de cet espace 
satisfaisant aux conditions suivantes : 
u„(f) — > u(f) uniformément sur [ a , b] pour 
chacune des trois fonctions A' 1 — ^ 1 , X * ,Y 
et x * X 2 . Alors u n (f) —+ li(f) pour toute 
fonction continue f. 

Ce théorème fournit une nouvelle 
démonstration, due à Bernstein, du théo- 
rème d’approximation polynomiale de 
Weierstrass. 

Théorème 5. On considère les polynô- 
mes de Bernstein : 

B n k = C***(l — jc)" - *, 0 ^ k ^ n. 

Si à tout /G C([fl, b]) on associe la 
fonction polynomiale u n (f) définie par : 

(»„(/■))(*)= ^V(£) »„,*(*), 

k = 0 

alors U n (f ) tend vers / uniformément sur 

[fl. b]. 

La convergence n’est pas très rapide 
car, si f est, par exemple, la fonction 
x | ->- -v 2 , on a I U„(f) -/ 1=1/4 II. 

D’ailleurs, l’approximation polyno- 
miale par des opérateurs positifs u n ne peut 
jamais être rapide, car on démontre que 
| u n (f ) —j J* n’est pas négligeable devant 
\jn 2 pour l’une au moins des trois fonc- 
tions I — ► 1, X 1 — * A\ X l— ^ X 2 . 

Enfin, le théorème de Korovkine 
s’étend aussitôt au cas des fonctions 
continues périodiques; il suffit que la 
convergence de u,,(f) vers j soit assurée 
pour les trois fonctions .y 1 — * % 

Y i—»- cos2 7DC, x l— * sin2 7LY. On retrouve 
ainsi la convergence uniforme des som- 
mes de Fejer o n (f ) pour toute fonction 
continue périodique ; ici encore la conver- 
gence est /ente car ||(J #I (/ ) — f J* est exac- 
tement de l’ordre de \/n lorsque 
f (X) = C0S2 7LY |. 


Consistance 

Dans de nombreux exemples, le processus 
d’approximation (u„) d’une application u 
de E dans F se présente sous la forme 
suivante : on se donne une suite (E„) de 
sous-espaces vectoriels de dimension finie 
d’un espace vectoriel normé E de fonctions 
telle que 

Qe„ 

n = 0 

soit dense dans E. On dit alors que le 
processus (u,,) est consistant si, pour tout 
élément cp G E,„ u n ((ç) = «(cp), c’est-à-dire 
u n = u sur E„. 

Un cas particulièrement important est 
celui où u n est défini à partir d’une suite 
( p n ) de projecteurs de E sur E„ grâce à la 
relation u n = U o p fr Si E = F = C(T) 
muni de la norme N-> et si E„ = X> n est 
l’espace vectoriel des polynômes trigono- 
métriques de degré ^ n, on peut prendre 
pour p n le projecteur orthogonal de E sur 
E„. Il en est de même si E = F = ?([a, h]), 
muni de la norme : 

Z 1 — N 2i ,(/) = £ |/(f ) 1 2 ir(r ) dt, 

où TT est un poids, c’est-à-dire une fonction 
positive intégrable donnée sur [ci, b] et si 

e„ = 

Lorsque E = F = C([ü, b]) muni de la 
norme et E„ = ‘S )V les interpolations de 
Lagrange ou, plus généralement, d’ H er- 
mite constituent aussi des exemples signi- 
ficatifs. 

Pour étudier la convergence des pro- 
cessus consistants, l’idée est de comparer 
u n (J) à un élément cp n (f) approchant f le 
mieux possible. Plus précisément, on note 
5 n (f) la distance d’un élémentfde E à E,„ 
définie par : 

b„(/) — d{f, E n ) = inf 1/ — qp || . 
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Comme E„ est de dimension finie, il 
existe au moins un élément tp,, (E E„ tel que 
II/— || — d(f y E„) ; on dit alors que 
optimise l’approximation de f par les 
éléments de E„. L’étude de ce problème est 
abordée au chapitre 8. 

Dans ces conditions, comme U n ((p n ) 

= 

Il «</)-«. (/)ll = Il («- «„)(/•- <p„) Il 

+IUJI). 

Le problème de la convergence du 
processus (u„) et de sa rapidité de conver- 
gence est alors séparé en deux questions 
totalement distinctes : 
l’évaluation de b n (f) qui est liée à la 
régularité de la fonction que l’on veut 
approcher ; 

l’évaluation de || u n || qui mesure la qualité 
du processus d’approximation. 

8. Optimisation d e Tapproxima- 
tion ; rapidité de convergence 

Optimisation de l’approximation 
Avec les notations du chapitre précédent, 
nous allons étudier les deux problèmes 
suivants : 

a) l’unicité de l’élément cp n de E„ opti- 
misant l’approximation de f par les élé- 
ments de E„ ; il est alors intéressant de 
construire des méthodes explicites de 
calcul de cp /f ; 

b) la distance Ô„(/ ) tend-elle vers 0 si n 
tend vers + oo ? Si oui, déterminer la 
vitesse de convergence en fonction des 
propriétés de J. 

Voici deux exemples classiques. 

Dans le premier, E est un espace 
vectoriel de fonctions 1-périodiques à 
valeurs complexes et E„ est le sous-espace 
vectoriel T> n des polynômes trigonométri- 
ques de degré ^ c’est-à-dire des com- 


binaisons linéaires des fonctions exponen- 
tielles t e 2inp! , où p ^ n. 

Dans le second, E est un espace vecto- 
riel de fonctions définies sur [ a , b] et E n est 
le sous-espace vectoriel f/'„ des polynômes 
de degré ^ n. 

Bien entendu, les réponses aux problè- 
mes précédents vont dépendre du type de 
convergence considéré. Nous examinerons 
principalement le cas des normes N 2 
(approximation en moyenne quadratique) 
et Ncc (approximation uniforme). 

Unicité de cp n 

Théorème 1. L’unicité de cp,, est assurée 
lorsque la boule unité est strictement 
convexe , c’est-à-dire si les relations 
fie || =|>'|| =1 et CLY + (3 y = 1 avec 
a > 0, p > 0, ci -j- p = 1 impliquent 
x = y. 

Cette dernière condition est réalisée 
pour l’espace E = L 2 (p) des fonctions de 
carré intégrable pour une mesure p muni 
de la norme N 2 , et, plus généralement, 
pour les espaces 1/(4) pour 1 < p < + oo. 
Elle ne l’est pas pour l’espace L ! (ju), ni 
pour l’espace E = C([a, h]) muni de la 
norme N x ; on peut relier ce phénomène à 
la forme des boules de R 2 pour ces mêmes 
normes (cf. figure in espaces vectoriels 
normes) . D’ailleurs, dans ces deux cas, on 
peut donner des exemples où il n’y a pas 
unicité de cp„ : il suffit par exemple de 
prendre E = C([0, 1]) muni de la norme 
N,. Si Eq est la droite vectorielle engendrée 
par la fonction t ■ - t , alors d( 1, E 0 ) est 
atteinte pour toutes les fonctions 
cp(f ) — a t où 0 ^ a ^ 2. 11 en est de 
même si E est l’espace C(T) des fonctions 
continues 1-périodiques et si E 0 est la 
droite 

vectorielle engendrée par la fonction 
t i— ► sin2 TT t. Cela tient au fait que toutes les 
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fonctions de Eq s’annulent en un même 
point. 

Ainsi, le problème de T unicité de la 
meilleure approximation uniforme dans 
E = C([fl, h]) est assez délicat. Pour le 
résoudre, on introduit le concept de SOUS- 
espace vectoriel régulier de fonctions 
(cf. supra , chap. 5). 

On a alors le théorème suivant, dû à 
Haar. 

Théorème 2. Soit E n un sous-espace 
vectoriel de C([tf, h]), ou de l’espace 
vectoriel C(T) des fonctions continues 
1-périodiques, muni de la norme de la 
convergence uniforme. Il est équivalent de 
dire : 

a) E„ est régulier ; 

b) l’unicité de cp /; est assurée pour tout 
élémentf’de C([c/, h]) (ou de C(T)). 

Ce théorème s’applique à la meilleure 
approximation polynomiale uniforme des 
fonctions continues, car le sous-espace 
vectoriel des fonctions polynômes de degré 
^ n est régulier. Il s’applique aussi à la 
meilleure approximation uniforme des 
fonctions continues périodiques par les 
polynômes trigonométriques, car le SOUS- 
espace vectoriel des polynômes trigono- 
métriques de degré ^ n est lui aussi 
régulier. 

Caractérisation et calcul explicite de <p n 
Théorème 3 (cas des normes quadrati- 
ques). Soit E„ un sous-espace vectoriel de 
dimension finie d’un espace vectoriel hil- 
bertien E. Alors çp tJ n’est autre que la 
projection orthogonale de f sur E„ ; autre- 
ment dit, cp„ = p n (j ), où p n est le projec- 
teur orthogonal sur E„. En particulier, 
l’application f i— ► cp w est linéaire continue 
et : 


N 2 (cp„) ^ N 2 (/), 

Kif ) 2 = n 2 (/-c Vn y = n 2 (/) 2 — n 2 (<p„) 2 . 


Si on se donne une base .... e,,) de 
E„, on peut calculer explicitement c p n . Si 
cette base est orthonormée, on a : 



K(/y 


n 



Sinon, les composantes de cp w se calculent 
à l’aide des déterminants de Gram, en 
particulier : 


Gram(/, i 0) . e„) 

" U> = Gram(e 0 e„) 

où Gram(.Vi , . ... x p )= det((.v ( x,)) 

(cf. espace de hilbert) . 

Le cas des normes uniformes est plus 
délicat. Pour simplifier, nous nous limite- 
rons au cas de l’approximation polyno- 
miale uniforme des fonctions continues à 
valeurs réelles, c’est-à-dire E = (?([«, b], 
R) et E„ = ‘J n , espace des polynômes de 
degré < IL On dit qu’une suite strictement 
croissante (/ j, {,) de points de [a, b] est 
alternante pour une fonction F de C([a, h]) 
si, pour toutj G [1, r], F(/ ; ) = N x (f) et si, 
pour tout y E [1, r — 1], F(/ / )F(/ /+1 ) < 0 ; r 
s’appelle la longueur de la suite. On a alors 
le théorème suivant. 

Théorème 4. Théorème dequioscillation 
de Tchebychew Soit /G C([t/, b]) et cp une 
fonction polynomiale de degré ^ n. Il y a 
équivalence entre : 

ü) la fonction tp est égale au polynôme 
de meilleure approximation cp /; ; 

b) il existe une suite alternante relati- 
vement à f— cp de longueur au moins 
n + 2. 

Ce théorème détermine cp„, mais il 
n’existe aucun algorithme simple dès que 
n est un peu grand. C’est néanmoins 
possible lorsque f est une fonction poly- 
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nomiale de degré n + 1. Grâce au théo- 
rème précédent, on démontre en effet la 
propriété extrémale des polynômes de 
Tchebychev, avec ici [a, b] = [- 1, 1] 
(cf. supra , chap. 5). 

Théorème 5. Soit T n le polynôme de 
Tchebychev de degré n ; alors : 

a) N»(T n ) = 2"" 1 et. pour tout poly- 

nôme unitaire P de degré n, on a 
N, (P) ^ 1/2 W_I , avec égalité si et seule- 
ment si P TJ2 n ~ l ; 

b) soit P un polynôme de degré n + 1, 
de coefficient dominant a,+, que l’on 
écrit : 


r=J\ T ' : 

P = 0 


alors : 


rf(P,E.)-|X. + I |-i«|a. + 1 |, 

n 

P = 0 

On notera que l’application P * cp„ est 
linéaire, mais, malheureusement, il n’est 
pas vrai, contrairement au cas des normes 
N 9 , que, si P est de degré n + 2, cp„ 
s’obtienne en prenant d’abord 
Q = <p n +i(P) et ensuite <p,(Q). Plus géné- 
ralement, l’application /*— ► cp w n’est pas 
linéaire. Cependant, en pratique, on utilise 
souvent une méthode télescopique : on 
commence par approcher f par un 
polynôme P„ +/ , de degré n -f* p suffisam- 
ment élevé pour obtenir la précision 
cherchée, par exemple en utilisant le 
développement taylorien de f à l’origine 
(s’il est connu), puis on développe P n+ 
dans la base des polynômes de Tchebychev 
et on tronque ie développement à 
Tordre n ; on obtient ainsi un polynôme ip„, 
qui n’est pas égal à cp n , mais dont 


on démontre qu’il en diffère fort peu. 
Une variante de cette méthode dans le 
cas périodique consiste à développer 
la fonction X»— */(c OSx) en série de Fou- 
rier : 


/ (cos x) = 


^ A, cos px 


p = o 

(ce qui revient à développerfen série de 
polynômes de Tchebychev : 


/<o = £wo, 

p = 0 

et à effectuer le changement de variable 
t =z cos.~). On calcule les coefficients de 
Fourier A, et le polynôme : 


Y. (O =]£ W) 


fournit une excellente approximation de f 
pour un polynôme de degré < n. On peut 
prouver que le gain par rapport au 
développement taylorien est de 1 / 2 ", ce qui 
est en accord avec les résultats du chapi- 
tre 5. 


Convergence de Ô n (f ) 

Il nous reste maintenant à étudier le 
second problème, qui concerne la conver- 
gence vers 0 de b n (f). Tout d’abord, 
le théorème d’approximation polyno- 
miale uniforme de Weierstrass signifie que 
b n (f) tend vers 0 dans les deux cas 
classiques E = C?([a, b]), E„ = i J n et 
E = C(T), E„ = pour la norme uni- 
forme N,. 

Comme la norme N x est plus fine que 
N -, sur un intervalle compact, le même 
résultat est valable dans Cë Cas pour la 
norme N ? et, par suite, pour les espaces 
hilbertiens L 2 ([tf, b]) et L’(T). 
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Les résultats explicites fournis par le 
théorème 3 permettent d’étudier des cas 
plus fins. 

Théorème 6 (théorème de Muntz). Soit 
E = [0, 1 ], (a,) une suite strictement crois- 
sante de nombres réels positifs telle que 
oc 0 = 0, et E„ l’espace vectoriel engendré 
pare a(> , e % ,oùe^t) -fi. 

1. Si E est muni de la norme N 2 , il est 
équivalent de dire : 

a) pour tout /E C([0, 1]), h n (f) — 0, 
c’est-à-dire la suite (e a ) est totale ; 

b) la série 

90 

Xi 

n - 1 

diverge. 

2. Cette équivalence reste valable si E 
est muni de la norme N,. 

Pour démontrer ce résultat, on calcule 
la distance de e p à E„ par la méthode de 
Gramm indiquée plus haut et on montre 
que cette distance tend vers 0 si et seule- 
ment si la condition b est réalisée. 

La méthode utilisée pour passer de N 2 
à N, x consiste en une inégalité du type 
Sobolev : sifest nulle en 0 et de classe C 1 , 
on a : 


Noo(/) ^ X N 2 (D/) ; 

pour approcher uniformément / par des 
éléments de E,„ il suffit donc d’approcher 
D/en moyenne quadratique. Ainsi, le cas 
de N x , d’accès difficile par une méthode 
directe, est résolu grâce à un détour par 
N 2 . Ces méthodes sont d’usage constant en 
analyse fonctionnelle. 

Enfin, la rapidité de convergence de 
b n (f) vers 0 dépend de la régularité de/ Ce 
phénomène est analogue à celui des séries 
de Fourier (cf. séries trigonomÉtriques). 
Pour mesurer de façon précise la régularité 
des fonctions continues, on introduit le 


module de continuité. Soit / une fonction 
continue sur un intervalle I de R ; pour 
tout Ô > 0, on pose : 

0 7 (5) = sup | f(x) -f(v) , pour x,y G I ; 

\x-y\ <ô 

cette notion est très commode car elle 
permet de décrire différentes classes de 
fonctions : 

la fonctionf’est uniformément continue 
sur I si et seulement si co^(ô) — ► 0 si ô — ► 0 ; 
la fonction / est lipschitzienne de rap- 
port k sur 1 si et seulement si ti)^(ô) kh. 

Plus généralement, f est holdérienne 
d’ordre a, pour 0 < a ^ 1, si et seule- 
ment si ü/5) ^ kb a . 

Dans le cas des normes N*, on introduit 
les classes de fonctions suivantes : 
l’espace vectoriel Lip a ([fl, b]) des fonc- 
tions holdériennes sur [a, b] d’ordre a, 
0 < a ^ 1, muni de la norme : 

/~N K (/) + X a (/), 

où : 


^a</) = SUp 
x ¥=y 


!/(■*)— /(y) I . 
\*—y I 


— pour tout p ^ 0, l’espace vectoriel 
Lip a,p(l a -> E]) des fonctions de classe CP 
sur [a, b] telles que DPfE Lip a ([a, b]) 
muni de la norme : 

/-* N .(/•)+ + N. (D?/) + MD'/). 


Le cas des fonctions périodiques est 
analogue. Les espaces vectoriels normés 
Lip u sont complets. 

Pour étudier S„(f), on commence par le 
cas des fonctions périodiques et on en 
déduit le cas C([— 1, 1]) par le changement 
de variable x = COS7I7. Considérons donc 
une fonction continue 1-périodique / 
L’idée est d’approcher f par COnvolu- 
tion avec des polynômes trigonomé- 
triques constituant une approximation 
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de la mesure de Dirac et d’évaluer 

Nous connaissons déjà les noyaux de 
Dirichlet et de Fejer : 


D.(fi = 


sin(2 n + 1)tt/ 


F , ( r ) 


-f* 


sin Ht 
smnirt 


sinTr t 


Mais le premier, n’étant pas positif, ne 
convient pas pour toutes les fonctions 
continues, et le second, bien que positif, 
fournit des convergences très lentes, même 
sifest très régulière. On utilise ici le noyau 
de Jackson : 



où ü n est une constante de normalisation. 
On a alors le théorème suivant. 

Théorème 7 (Jackson). Il existe une 
constante (3 > 0 telle que, pour toute / 
continue périodique, on ait : 

N„(/-/.J„) < k(~) 

En particulier : 

Ainsi, plus f est régulière, plus la 
décroissance de b n if) est rapide. En par- 
ticulier, si /G Lip a , ô„(/') = 0( 1 jn a ). 

Pour/G Lip„„ on introduit les noyaux : 



et le théorème 7 se généralise par le 
théorème suivant. 

Théorème 7\ Il existe (3 > 0 tel que, 
pour toute fonction périodique de classe 
ÇP # a i t 


En particulier, si on a /G Lip a/7 , alors 

ô„(/')= 0(1/^+“). 

Il est tout à fait remarquable que, 
inversement, si f est « bien approchée » 
par les polynômes trigonométriques, c’est- 
à-dire si b n (f) tend vers 0 assez rapide- 
ment, alors f est assez régulière. 

Théorème 8 ( Bernstein ). Si 0 < u <1. 
p ^ 0, alors : 

s »tf) = °(^G/eLip a ,,. 

Cela prouve que les estimations four- 
nies par les théorèmes 7 et 7’ sont les 
meilleures possibles. Enfin, si f est Coo 
(resp. holomorphe dans une bande 
\mz < y), alors b n (f) est à décroissance 
rapide (resp. exponentielle) ; ici encore, les 
réciproques sont exactes. On notera enfin 
qu’il existe des fonctions continues f telles 
que b n (f) décroisse arbitrairement 
lentement. Enfin, les théorèmes 7 et 7’ 
s’appliquent sans changement au cas 
des fonctions continues sur un intervalle 
[< a , h], mais ici, les réciproques sont plus 
délicates. 

Nous ne développerons pas non plus le 
cas, étudié par Favard et Krein, où 
h]) est muni de la norme quadrati- 
que ; les théorèmes 7 et 7’ s’étendent sans 
changement, les espaces Lip a/; étant rem- 
placés par les espaces de Sobolev H Q+/ \ 

Convergence des processus 
d’approximation consistants 
Nous nous bornerons ici à étudier le cas 
E = C(T), ou E = <?([£/, b ]), où u = I F et 
où le processus (u n ) d’approximation est 
défini par une suite de projecteurs p n de E 
sur E„. D’après les résultats du chapitre 7, 
la convergence de PÀf) vers un élément f 
de E est contrôlée par la relation : 

(1) 6,(7) < I \Pnif) -/I! 6 »„(/■)( 1 + Il P„\\l 
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Ayant étudié précédemment la rapidité 
de convergence vers 0 de il nous 

reste à examiner le comportement de \\p n ||. 
Voici tout d’abord un cas idéal. 

Théorème 1. Processus consistants et 
stables. Tout processus à la fois consistant 
et stable est convergent sur E tout entier 
car, dans ces conditions, h n (f) ► 0 et 
| u n | ^ M. En outre, la vitesse de conver- 
gence est de même ordre de grandeur que 
celle du processus optimal. 

Nous examinerons maintenant d’abord 
la possibilité d’obtention de processus 
d’approximation polynomiale à la fois Sta- 
bles et consistants. Ici encore, la situation 
est radicalement différente suivant qu’il 
s’agit d’approximation en moyenne qua- 
dratique ou d’approximation uniforme. 

Approximation polynomiale quadratique 

Théorème 2. Stabilité et convergence de 
l’approximation polynomiale en moyenne 
quadratique. 

1. Cas des fonctions périodiques. E est 

l’espace vectoriel L 2 (T) des fonctions de 
carré intégrable 1-périodiques muni de la 
norme E„ = ~G n est le sous-espace 

vectoriel des polynômes trigonométriques 
de degré ^ n et p n est le projecteur 
orthogonal de E sur E,, qui, à toute 
fonction /, associe la somme partielle S n (f) 
de sa série de Fourier. 

2. Cas des fonctions définies sur un 
intervalle I de R. On se donne un poids tt 
défini sur 1, et E est l’espace vectoriel 
L 2 (I, tt) des fonctions de carré intégrable 
pour la mesure de densité tt muni de la 
norme N 2 n ; ici E„ = (F sous-espace vec- 
toriel des polynômes de degré n etp„ est 
le projecteur de E sur E„ qui associe à / la 
somme partielle s n (f) de son développe- 
ment suivant le système de polynômes 
orthogonaux défini par j[. 


Dans les deux cas, \\p n || = 1, donc le 
processus est à la fois stable et consistant ; 
nous avons vu précédemment qu’il est 
d’ailleurs optimal. En particulier, la 
convergence a lieu pour tout élément / de 
E et elle est d’autant plus rapide que / est 
régulière : Il existe (3 > 0 tel que : 

/e H“+/> =>«/—*„(/•) ll 2 < 

Approximation polynomiale uniforme 

Théorème 3 ( théorème de Bernstein-Fuber). 
Convergence de V approximation polyno- 
miale trigonomé trique uniforme. On prend 
E = C(T) muni de la norme N* et 

E„ = B„. 

1. Le processus de Fourier n’est pas 
stable, car la norme du projecteur p n : 

f l— * s n(f ) est égale à || D,, j|j , où D„ est le 
noyau de Dirichlet, et | D,, ||j ~ (2/7T)ln/?. 
Cependant, la convergence uniforme de 
S n (f) vers f a bien lieu dès que le module 
de continuité (ùf\jri) est négligeable 
devant 1/ln n , et, en particulier, si / est 
holdérienne d’ordre a. En outre, la perte 
de rapidité par rapport au processus opti- 
mal est faible, puisque : 

!/-*„(/) IL | ln«) 

En particulier, si / (E Lip a/; : 

l/-*„(OlL = o(^); 

ainsi, la convergence est d’autant plus 
rapide que f est régulière. 

2. Le processus de Fourier est optimal 
parmi les processus consistants. On peut en 
effet démontrer que, pour tout projecteur 
continu p n de E = C(T) sur ü w , on a 
Il Pn\> Il DJ:,:. 

3. En particulier, le processus consis- 
tant (p n ) n’est jamais stable, et, comme 
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(E, N,) est complet, il existe des fonctions 
continues / telles que || p n (f) ||x soit non 
borné ; bien entendu, pour une telle fonc- 
tion / la suite p n (f) ne tend pas vers / 

Ainsi, il n’existe pas de processus 
d’approximation polynomiale trigonomé- 
trique à la fois consistant et uniforme, ou, 
ce qui revient au même, convergent sur 
tout C(T). A fortiori, il n’existe pas de 
processus consistant positif, ce qui résulte 
aussi de la méthode de Korovkine. 

Par changement de variable, on obtient 
le théorème suivant. 

Théorème J. Convergence de V approxi- 
mation polynomiale uniforme . 

On prend E = ( ô ([a, h]) muni de la 
norme uniforme et E„ = Ü“ ;J . 

1. Le processus de développement de / 
en série de polynômes de Tchebychev n’est 
pas stable, car ||/?, ? |j ~ I/ln n. Mais il 
converge pour les fonctions telles que 
iùfiX/n) soit négligeable devant l/ln/7, et 
d’autant plus rapidement que / est plus 
régulière. 

2. Ce processus est optimal parmi les 
processus consistants. 

3. En particulier, il n’existe pas de 
procédé d’approximation polynomiale uni- 
forme à la fois consistant et stable. On 

notera que ((“([a. h]), N,) étant complet, la 

convergence simple n’est même pas assu- 
rée. 

En outre, pour les fonctions suffisam- 
ment régulières, on peut remonter de 
l’approximation en moyenne quadratique 
à l’approximation uniforme. Il suffit pour 
cela de prouver que la série Ta n (j)e„ 
donnant le développement de / converge 
normalement sur l’intervalle considéré. En 
effet, dans ces conditions, S n (f) converge 
uniformément vers une fonction continue 
g ; comme la convergence uniforme impli- 
que la convergence en moyenne quadrati- 


que sur un intervalle compact, S n {f) 
converge aussi vers g en moyenne quadra- 
tique, et. par unicité de la limite, g = f 
Pour établir la convergence normale, on 
majore | e,, ^ et on utilise le fait que, plus 
/est régulière, plus la suite (Ci. n (f)) décroît 
rapidement. 

Le cas des séries de Fourier est bien 
classique : sif est continue et de classe C 1 
par morceaux, la série : 

+ * 

2ja.(f)l 

n - — 00 

est convergente, ce qui assure la conver- 
gence normale de la série considérée puis- 
que \e n II* = 1 (cf. SERIES TRIGON OMÉTRI- 
guEs). On dispose de résultats analogues 
pour les développements en séries de 
polynômes orthogonaux (cf. polynômes 
orthogonaux). Dans le cas des dévelop- 
pements en série de polynômes de Legen- 
dre, si f est continue et de classe C 1 par 
morceaux sur [- 1, + 1], la série L Cü n {f) 
e n converge normalement sur tout com- 
pact de ]— 1, 1[ et sifest de classe C 2 , cette 
convergence est normale sur [- 1, -/ 1]. 
Pour les développements en série de poly- 
nômes de Hermite, si f est continue et de 
classe C 1 par morceaux sur R et si f etf” 
sont de carré intégrable pour le poids TT, 
alors la convergence est normale sur tout 
compact de R. 

Cette même idée s’applique encore à 
l’étude de la convergence uniforme des 
développements en série de fonctions pro- 
pres des équations de Sturm-Liouville 
(cf. équations différentielles, ch dp. 3) ou 
des équations intégrales de Fredholm (cf. 
équations intégrales). 

Dans le même ordre d’idée, signalons le 
théorème de Kademacher-Menchov : si L 

CX/j | 2 (ln n)~ est fini, alors E converge 

vers f presque partout. 
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Nous examinerons enfin le cas des 
processus interpolatoires. 

Théorème 4. Convergence des processus 
interpolutoires. Ici E = ?([a, h]) muni de 
N w , Soit S un système interpolateur sur 
[a, h] et L„ le projecteur de E sur $ n qui à 
tout élément / de E associe le polynôme 
d’interpolation de Lagrange (ou de Her- 
mite) L,(f) (cf. chap. 5). 

1. Pour tout S, || L w | domine ln n ; les 
processus interpolatoires ne sont donc ni 
stables ni convergents sur E. 

2. Si on prend pour S le système de 
Tchebychev, où [a, b] = [— 1, 1] et où 
a, = cos[(2 \j + l)7T/2«] pour 0 ^ j ^ n 

1, et L n (f) le polynôme d’interpolation de 
Lagrange associé à f alors | L„ || ~ ln/7. 
Autrement dit, l’interpolation de Tcheby- 
chev est sensiblement optimale parmi les 
processus consistants d’approximation 
polynomiale. En particulier, L Jf) 

converge uniformément vers f dès que 
(i)|( \jn) est négligeable devant 1 /ln/7 et, si 
/£ Lip u / , : 

II, (/■)—/!. = o(^7Pt)- 

En revanche, si on prend des subdivi- 
sions à pas constant, || L„ || croît exponen- 
tiellement, si bien que le processus peut 
fort bien diverger, même sif est analytique. 

Généralisations 

Comme l’approximation polynomiale uni- 
forme ne fonctionne pas bien, on est 
amené à choisir des fonctions un peu plus 
générales que les polynômes, à savoir 
polynomiales par morceaux. 

Le cas le plus simple est celui des 
fonctions affines par morceaux. 

Théorème 5. Ici E = C([tf, h]) muni de 
N,. Soit S„ la subdivision de [a, b] à pas 
constant (b — a)/ h et p n le projecteur de E 
sur le sous-espace vectoriel A, des fonc- 


tions continues et affines sur chaque inter- 
valle [tj, tj+i\ de S„. Alors le processus 
consistant (p n ) est stable car \\p n || = 1. En 
outre : 

I f—p*(f)L < w /(^p); 

mais la rapidité de convergence n’est guère 
améliorée si f est régulière (cf. SUpVÜ , 
chap. 5). 

C’est pourquoi on peut alors recourir 
aux fonctions spline. 

Théorème 5\ Convergence de l approxima- 
tion pur des fonctions spline. Soit encore S„ 
comme dans le théorème 5 et soit A„„ 
l’espace vectoriel des fonctions spline cubi- 
ques associées à S n et p n le projecteur de E 
sur A,„ qui à toutf E E associe la fonction 
spline cubique S ff) interpolant f (cf. 
supra, chap. 5). Alors le processus consis- 
tant (p n ) est stable et : 

II/— S„(/)IL < PUy(E^) 

Cette fois, la rapidité de convergence 
est améliorée si f est plus régulière (jusqu’à 
la classe C 4 ). 

Le cas des fonctions périodiques est 
entièrement analogue. 

JEAN-LOUIS OVAERT et JEAN -LUC VERLEY 
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FONCTIONS ANALYTIQUES 


D epuis 1’Antiquité, on connaît en sub- 
stance la série géométrique sui- 
vante : 

= l + x + x 2 + ... +*" + ...(0 <* < 1 ). 

1 — x 

Une des grandes découvertes qui jalon- 
nèrent la formation du calcul infinitésimal 
au milieu du XVII e siècle fut la possibilité de 
représenter les fonctions « usuelles » (loga- 
rithme, exponentielle, fonctions trigono- 
métriques, etc.) par des développements 
en série analogues. Au XVIII e siècle, la 
plupart des mathématiciens en étaient 
arrivés à ne plus guère considérer comme 
dignes d’intérêt que les fonctions dites 
« analytiques », égales à la somme d’une 
série convergente du type : 

2 >. (*-*.)• 

n = 0 

au voisinage de chacun des points A' 0 de 
leur domaine d’existence. 

La plupart des fonctions considérées 
a u XVIII e siècle étaient implicitement 
supposées analytiques, et J. L. Lagrange, 
dans sa Théorie des fonctions analytiques 
(1797), tente de fonder une théorie for- 
melle de la dérivation, indépendante de la 
notion d’infiniment petit ou de limite, sur 


le concept de développement en série 
entière. 

Si, depuis le début du XIX e siècle, il a 
fallu abandonner ce point de vue trop 
exclusif, et donner droit de cité à des 
fonctions bien moins « régulières » que les 
fonctions analytiques, le rôle de ces der- 
nières reste fondamental dans toutes les 
parties des mathématiques. En fait, le 
concept d’analyticité s’est même élargi 
depuis le début du XX e siècle ; la définition 
d’une série entière : 

Z c - x " 

n = 1 

et le calcul sur ces séries gardent en effet 
un sens lorsque les coefficients c„ et la 
variable x ne sont plus nécessairement des 
nombres réels ou complexes, mais plus 
généralement appartiennent à un corps 
value complet, par exemple le corps des 
nombres /sadiques (cf. théorie des nom- 
bres Nombresp-adiques) : il ne s’agit pas 
là d’une généralisation sans motivation, 
car ce qu’on appelle maintenant Y analyse 
p-adique a pris dans ces dernières années 
une importance de plus en plus grande 
dans toutes les questions touchant la théo- 
rie des nombres algébriques (cf. théorie 
des nombres Nombres algébriques). 

Toutefois, une étude plus poussée 
révèle que la possibilité de donner une 
définition de la notion de « fonction ana- 
lytique » sur un corps valué complet quel- 
conque K masque en réalité de profondes 
différences de comportement pour ces 
fonctions, selon la nature du « corps de 
base » K considéré. Déjà, entre le cas réel 
(K = R) et le cas complexe (K = C), il y 
a un clivage abrupt, la théorie des fonc- 
tions anaiytiques de variabies complexes 
étant incomparablement plus riche et plus 
simple que celle des fonctions analytiques 
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de variables réelles (cf. représentation et 
approximation des fonctions, chap. 1) : 
pour ne citer qu’un exemple, la seule 
existence de la dérivée première pour une 
fonction d’une variable complexe la rend 
ipso facto analytique. La raison de cette 
différence doit être cherchée dans la théo- 
rie de Cauchy , fondée sur le merveilleux 
outil que constitue l’intégrale curviligne 
des fonctions de variable complexe, d’une 
souplesse et d’une puissance incompara- 
bles. 

C’est seulement de cette théorie et de 
ses extensions qu’il est question dans les 
articles qui suivent. Jusqu’à la fin du 
XIX e siècle, on ne s’est guère occupé que de 
la théorie des fonctions d’une seule varia- 
ble complexe, qui offrait aux recherches un 
champ aussi vaste que riche (d’ailleurs loin 
d’être épuisé même à l’époque actuelle) : 
en dehors de ses innombrables applica- 
tions dans toute l’analyse, la théorie de 
Cauchy rejoignait la géométrie différen- 
tielle par ses liens avec la représentation 
conforme et les surfaces minimales, la 
théorie du potentiel (en mathématiques et 
en physique) par ses étroites relations avec 
les fonctions harmoniques de deux varia- 
bles, et (ce qui est sans doute le plus 
inattendu) l’arithmétique supérieure avec 
la théorie analytique des nombres (séries 
de Dirichlet, méthode de Hardy- 
Littlewood). 

Les conceptions les plus profondes qui 
se font jour pendant cette période sont 
celles de Riemann, qui parvint à maîtriser 
les difficultés que créaient depuis Bernoulli 
et Euler les prétendues « fonctions multi- 
formes » par l’invention géniale des « sur- 
faces de Riemann », premier exemple de 
ce que l’on appelle maintenant les « varié- 
tés holomorphes », et point de départ de la 
topologie moderne. La nécessité d’admet- 
tre comme domaines de définition des 


fonctions holomorphes des variétés plus 
générales que les ouverts des espaces C n 
devait apparaître avec encore plus de 
netteté dans les études sur les fonctions de 
plusieurs variables complexes. Cette étude 
ne commença guère qu’au début du XX e siè- 
cle ; dès les premiers travaux sur la ques- 
tion, on se rendit compte des différences 
profondes qui la distinguaient de la théorie 
des fonctions d’une seule variable com- 
plexe, qui apparaît maintenant comme un 
cas d’exception ; de ce fait, il fallut forger 
de nouveaux moyens d’attaque, qui ont 
surtout été l’œuvre de H. Cartan et K. Oka 
dans les années 1930 - 1955 . La tournure 
essentiellement géométrique qu’a prise 
cette théorie lui vaut le nom amplement 
justifié de géométrie analytique sous lequel 
on la désigne aujourd’hui, et la rapproche 
étroitement de la géométrie algébrique 
moderne : le parallélisme des énoncés dans 
ces deux théories est tout à fait remarqua- 
ble. mais les méthodes de démonstration 
sont en général très différentes, et beau- 
coup plus délicates pour la géométrie 
analytique. 

Les liens entre la théorie des fonctions 
analytiques et la géométrie algébrique 
remontent d’ailleurs beaucoup plus haut, 
avec la théorie des fonctions elliptiques et 
des intégrales abéliennes, qui constituèrent 
dans la première moitié du XIX e siècle un 
des triomphes de la théorie de Cauchy et 
furent au centre des recherches de Rie- 
mann. La théorie des fonctions elliptiques 
conduisit un peu plus tard à l’étude de la 
fonction modulaire, premier exemple des 
fonctions automorphes d’une variable com- 
plexe, brillamment développée par Félix 
Klein et surtout Henri Poincaré. Par là 
même, la théorie des fonctions analytiques 
entrait en contact avec la théorie des 
groupes ; les rapports entre ces théories 
sont devenus encore plus étroits à l’époque 
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moderne, lorsque Siegel, en généralisant 
aux fonctions de plusieurs variables com- 
plexes la notion de fonction automorphe, 
a placé la théorie de ces dernières dans ce 
qui semble son cadre naturel, la théorie des 
espaces symétriques d’Élie Cartan. 

JEAN DIEUDONNÉ 


A. Fonctions analytiques 
d’une variable complexe 

On se propose, dans cette partie, d’expo- 
ser, avec des démonstrations quasiment 
complètes, les résultats les plus élémentai- 
res de la théorie des fonctions analytiques 
d’une variable complexe : les deux derniers 
chapitres sont consacrés à quelques résul- 
tats sans démonstration. Historiquement, 
l’extension au cas complexe de nombreu- 
ses fonctions classiques a été réalisée par 
l’intermédiaire des développements en 
série ; les séries entières restent à la base de 
l’étude locale des fonctions analytiques. 
Avec l’introduction de l’intégrale curvili- 
gne, on peut aborder des problèmes glo- 
baux, comme la recherche des primitives, 
qui font apparaître des conditions de 
nature « géométrique » ou, plutôt, topolo- 
gique, imposées aux ouverts du plan com- 
plexe ; les représentations intégrales de 
Cauchy sont à la base du calcul des résidus, 
qui a d’innombrables applications prati- 
ques. 

On a passé sous silence les résultats 
relatifs aux fonctions harmoniques de deux 
variables, qui ne sont autres que les parties 
réelles de fonctions anaiytiques, en ren- 
voyant à l’article potentiel et fonctions 
HARMONIQUES. 


i. Séries entières 

La définition et l’étude des fonctions 
analytiques reposent sur la notion de série 
entière, c’est-à-dire de série de la forme : 
00 

(1) a„(z — a)", 

rt = 0 

où Cl et les a n sont des nombres complexes 
donnés ; on dit qu’une telle série (1) est une 
série entière de centre a et de coefficients 
a,,. 

On dit que la série (1) converge norma- 
lement dans un ensemble K C C si la série 
des modules de ses termes est uniformé- 
ment convergente pour z K. Rappelons 
qu’il suffit pour cela qu’il existe une série 
numérique convergente de terme général 
a n telle que a n (z — a) n | < a„ pour tout 

ne NctzGK. 

On désigne, dans ce qui suit, par 
D (a. r) et D (cl r) les disques ouvert et 
fermé de centre a et de rayon r, c’est-à-dire 
les ensembles de nombres complexes z tels 
que 3 a < T et | z (l Y respective- 
ment. 

Convergence 

Étudions l’ensemble des nombres comple- 
xes z pour lesquels la série (1) est conver- 
gente. Posant Z — z — Cl pour simplifier, 
on se ramène, par une translation, à une 
série entière : 

( 2 ) 

n = 0 

de centre 0. 

Théorème L Soit R (éventuellement 
égal à 0 ou à — [— a?) défini par la formule 
d >u n'àxccùmi u 

(3) ^ lim (sup a '*) ; 
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alors, pour tout r < R, la série (2) 
converge normalement dans le disque 
fermé D(0, r) (en particulier, cette série 
converge absolument pour | Z < R) et 
diverge pour Z > R. 

Ce nombre R est appelé le rayon de 
convergence de la série entière (2) et le 
disque ouvert correspondant D(0, R), qui 
est éventuellement vide ou égal au plan 
complexe tout entier, est appelé le disque 
de convergence de cette série. Remar- 
quons que le théorème n’affirme rien pour 
Z | = R ; toutes les circonstances peuvent 
se rencontrer : divergence en tout point de 
ce cercle, convergence avec ou sans 
convergence absolue en certains points, 
convergence partout (cf. infra , Principe des 
zéros isolés). 

Il faut indiquer la démonstration du 
théorème 1. Supposons d’abord R > 0 et 
soit r < R : choisissons p tel que 
r < p < R. D’après (3), on a : 

1/P >\a n 

soit a, p' 1 < 1, pour n assez grand. Pour 
n assez grand et | Z ( r, on a donc : 

l a «z*| < Kl r’ =|«„|p"(^)” < (jj)"; 

ainsi le terme général de (2) est majoré en 
module pour Z £ D (0, r) par le terme 
général d’une série géométrique conver- 
gente, d’où la convergence normale. Réci- 
proquement, soit Z > R. D’après (3), il 
existe alors pour n une infinité de valeurs 
telles que /a „ fl n > 1/[Z |, soit a n Z n > 1 ; 
ainsi le terme général de la série (2) ne tend 
pas vers 0 et cette série diverge. 

Pour trouver un rayon de convergence, 
on utilise rarement la formule (3), dont 
l’intérêt est surtout théorique, mais on 
étudie, suivant les valeurs Z, la conver- 
gence absolue de la série (2) en utilisant les 
critères classiques (cf. séries et produits 


infinis) . Ainsi, la série de terme général 
n ! z n a un rayon de convergence nul 
(critère de d’Alembert) ; la série : 


X 



dont la somme est la fonction exponen- 
tielle complexe (Cf. exponentielle et 
LOGARITHME, chap, 4), converge absolu- 
ment pour tout z et a donc un rayon de 
convergence infini. Les séries : 



fl = 0 a = 0 n = 0 


Z n 

«2 


ont chacune un rayon de convergence égal 
à 1, mais ont des comportements très 
différents pour z = 1 : la première ne 
converge en aucun point de ce cercle 
puisque alors son terme général est de 
module égal à 1 ; la deuxième converge 
(mais pas absolument) en tout point de ce 
cercle différent de 1 et diverge pour z = 1 I 
la troisième converge normalement pour 


Fonctions analytiques 

Soit U un ouvert du plan complexe et 
f : U — ► C une fonction à valeurs com- 
plexes. On dit que f est analytique ou 
holomorphe dans U si elle est développable 
en série entière au voisinage de tout point 
de U, c’est-à-dire si, pour tout a G U, il 
existe une série entière de centre a dont la 
somme est égale à /(z) dans un disque de 
centre a : 

(4) m^aAz-aY, \z — a\<r. 

Remarquons que les coefficients a„ et le 
nombre r > 0 dépendent du point a consi- 
déré. A priori le nombre r est inférieur ou 
égal au rayon de convergence de la série 
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qui figure dans (4). Remarquons que cette 
série est normalement convergente dans 
tout disque fermé de rayon assez petit 
(théorème 1 ), et, par suite, j est une 
fonction continue dans U. 

Voici, en liaison avec ce qui précède, un 
important exemple de fonction analytique. 
Théorème 2. La somme d’une série entière 
est analytique dans son disque de conver- 
gence. 

On se ramène par translation à une 
série entière de centre 0 : 


La fonction f est donc somme d’une 
série entière de centre Zq dans le disque 
ouvert D(z 0 , R Zq [) ; remarquons que 
cette série a donc un rayon de convergence 
R — | z 0 |, mais ce rayon de convergence 
peut être strictement plus grand. Le disque 
de convergence « déborde » alors du dis- 
que de convergence de la série initiale, et 
cela permet de prolonger la fonction / en 
une fonction analytique dans la réunion 
des deux disques (cf. chap. 7). 


/(z) = y 1 g.z", 

n = 0 

de rayon de convergence R ; soit z 0 un 
point du disque de convergence et posons 
Z = Zq + (z Zq), La formule du binôme 
de Newton donne : 


n 

Z " = (Zo + (Z — Z 0 ))" = £ C'z'-'iz-zoy, 


P = 0 


d’où : 


/(z)= 2/"( Y J c ' z o- p ( z - z ° y )- 

n — 0 p = 0 

On montre alors que, pour : 

|z— z 0 | < R — |z 0 |, 

la série double ci-dessus est sommable ; on 
peut donc intervertir les deux signes Z de 
sommation, d’où : 


Principe des zéros isolés 

Examinons maintenant le comportement 
d’une fonction analytique au voisinage 
d’un point où elle s’annule. 

Soit f une fonction analytique dans un 
ouvert U et a (E U un zéro de f La 
fonctionf’est développable en série entière 
au voisinage de a, c’est-a-dire que l’on a (4) 
dans un disque D(fl, r) OÙ üq — f (a) = 0 . 
Si tous les coefficients de la série (4) ne sont 
pas nuis, ce qui aura lieu en particulier si 
f n’est pas identiquement nulle dans 
D(fl, r), désignons par a /. le premier 
coefficient non nul ; on a alors : 

00 

(5) f(z) = ^a n (z—a)" 

p = k 

= (z-af^a p+k (z-ay 
= (z— a) k g(z), 


/(z) = ^(z— z 0 y 

P = 0 n=p 

= y>-z o) *’ 

P =0 

avec z-z,, < R — z 0 |, en posant : 

UC 

cp=Y J a " cp » z °- p ' 

n=p 


où la fonction g est analytique dans D(tf, 
r) et g(n) = cij. 7 ^ 0. Le nombre entier k 
ainsi déterminé s’appelle, par analogie 
avec le cas des polynômes, Von/re du zéro 
a. Puisque la fonction est continue et prend 
une valeur non nulle en fl, il existe un 
disque D (fl, p) C D(fl, r) dans lequel elle 
ne s’annuie pas ; ainsi, z — a est ie seui 
zéro de f dans le disque D(fl, p). On a ainsi 
obtenu le principe des zéros isolés, que l’on 
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peut aussi énoncer ainsi : Soit f une 
fonction analytique dans un ouvert U ; si 
un point a E U est limite d’une suite de 
zéros de f\ alors f est identiquement nulle 
dans tout un disque de centre a. Il en 
résulte aussi que, si la somme d’une série 
entière de centre a est identiquement nulle 
dans un disque de centre a , alors tous ses 
coefficients sont nuis ; on en déduit immé- 
diatement Y unicité du développement en 
série entière d’une fonction analytique au 
voisinage de tout point. 

Les résultats précédents sont dits 
locaux : ils s’appliquent à des disques de 
rayons assez petits. Pour « globaliser », 
nous aurons besoin d’introduire une 
notion topologique qui joue un rôle essen- 
tiel dans tout ce qui suit. On dit qu’un 
ouvert U est connexe s’il ne peut pas 
s’écrire comme une réunion de deux 
ouverts non vides disjoints ; un ouvert 
connexe est souvent appelé un domaine. 
Tout ouvert quelconque du plan est une 
réunion de domaines deux à deux disjoints 
appelés les composantes connexes de cet 
ouvert. La condition de connexité équivaut 
à ceci : deux points quelconques de U 
peuvent être joints par une ligne brisée 
entièrement contenue dans U (fig. 1) : 



supposons d’abord U connexe et soit 
a E U ; désignons par U, l’ensemble des 
points de U qui peuvent être joints à a par 
une ligne brisée située dans U et par LL 
l’ensemble des points pour lesquels il est 
impossible de trouver une telle ligne brisée. 
L’ensemble U, est ouvert, car, pour tout 
point b E U„ il existe un disque D de 
centre b contenu dans U, et ce disque est 
en fait contenu dans Uj, car tout z E D 
peut être joint à (i par une ligne brisée dans 
U : il suffit de « rajouter » à la ligne brisée 
joignant a et b le segment d’origine b et 
d’extrémité -, qui est contenu dans D, donc 
dans U. Pour la même raison l’ensemble 
U 2 est aussi ouvert, car, si c E U 2 , il existe 
un disque de centre c contenu dans U, et 
ce disque est contenu dans LL ; en effet, s’il 
contenait un point b E U„ on pourrait 
joindre a à c par une ligne brisée en 
rajoutant le segment d’origine b et d’extré- 
mité c à la ligne brisée joignant a à b, 
ce qui contredit CE U 2 . Puisque 
u = U, u U 2 , et U, non vide car il 
contient a. on a nécessairement U 2 = 0. 
Réciproquement , faisons l’hypothèse que 
deux points de U peuvent toujours être 
joints par une ligne brisée située dans U ; 
on va supposer que U peut s’écrire 
U, U U 2 , où U, et U 2 sont des ouverts non 
vides disjoints et aboutir à la contradiction 
qu’ils ne sont pas disjoints. Soit fl E Uj et 
b E U 2 ; il existe une ligne brisée L C U 
image du segment [0, 1] par une fonction 
affine par morceaux t ' * y(t) d’origine a et 
d’extrémité b , c’est-à-dire telle que 
y(0) = a et y(l) = b. Soit A l’ensemble 
des î E [O. 1] tels que y([0, t]) C U, et soit 
a la borne supérieure de A ; puisqu’il existe 
un disque ouvert de centre a contenu dans 
Uj, on a a > 0. De plus, y(a) E U,, car, 
sinon, y(a) appartiendrait à LL et, puisque 
U 2 est ouvert, il existerait tout Un intervalle 
]a q, a] dont l’image par y serait COîlte- 
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nue dans LU, en contradiction avec la 
définition de a ; il suffit donc de montrer 
que a=l, d’où ù = y(1)EUi, soit 
U, il \J-y ^ 0. Or, si a < 1, comme y(a) 
appartient à Uj, qui est ouvert, il existerait 
tout un intervalle [a, 0( + r}'[ dont l’image 
par y serait contenue dans U„ en contra- 
diction avec le fait que a soit la borne 
supérieure de A. 

Nous étant ainsi un peu familiarisés 
avec la notion d’ouvert connexe, on peut 
énoncer le principe du prolongement ana- 
lytique. Soit f et g deux fonctions analyti- 
ques dans un ouvert connexe U ; s’il existe 
une suite de points distincts z n E U conver- 
geant vers a U, avec f(z n ) = g ( Z n ), 
alors on a identiquement/ (z) = g (z) dans 
tout U. Ce principe pourra s’appliquer par 
exemple si on a / (z) = g (z) en tous les 
points d’une «ligne », ou, de manière 
encore plus particulière, si / et g sont égales 
dans un ouvert non vide inclus dans U. 
C’est la justification correcte du « prolon- 
gement des égalités » au domaine com- 
plexe : Si deux fonctions analytiques dans 
un même ouvert connexe U sont égales sur 
U H R supposé non vide, alors elles sont 
égales dans U tout entier, ce qui permet 
d’étendre au champ complexe des formu- 
les connues dans le cas réel. 

Établissons ce principe du prolonge- 
ment analytique. Soit U, l’ensemble des 
points de U au voisinage desquels / g est 
identiquement nul, soit U 2 son complé- 
mentaire dans U. Tout point de U, est 
centre d’un disque dans lequel f-g est 
identiquement nul, et, par suite, tout ce 
disque est dans U, ainsi U| est ouvert et 
il est non vide, car d’après le principe des 
zéros isolés, il contient a. Montrons que 1/ 
est ouvert aussi, ce qui montrera, puisque 
ü est connexe, que U? = 0. Ceia résulte 
de la continuité en b , ou, si f(b) ~ g (b), 
du principe des zéros isolés ; en effet, si 


b £ U 2 , f— g n’est pas identiquement nul 
au voisinage de b , et, par suite, il existe tout 
un disque de centre b dans lequel b est le 
seul zéro éventuel de / g, ce qui entraîne 
que ce disque est contenu dans U% 

2. La dérivation complexe 

Soit U un ouvert du plan et / une fonction 
à valeurs complexes définie dans U. On dit 
que f est dérivable au sens complexe en un 
point Zq = Xq + /> 0 E U si l’expression : 

/«o + H)— /fro) 

U 

tend vers une limite f ' (zq) lorsque le 
nombre complexe U = S + it tend vers 
zéro en module (c’est-à-dire lorsque (s, t ) 
tend vers (0, 0) dans R 2 ) ; le nombre 
complexe / '(z 0 ) s’appelle la dérivée de / au 
sens complexe au point z 0 . 

Équations de Cauchy-Riemann 
La condition de dérivabilité complexe au 
point Zq peut aussi s’écrire : 

fi? 0 + u)—f{z Q ) = Uf\z Q ) + UE{U), 

où e(u) tend vers 0 pour 2/ | — ► 0. Si on 
pose / (x -f- iy) = /(. Y, y ), on aura : 

(*0 + ^0 + /)— /fco.J'o) 

= {s + it )f'(z o) + E(S, t ) VPTT/ 

ce qui exprime que la fonction f (x, y), 
considérée comme fonction des deux 
variables réelles x et est dérivable (cf. 
CALCUL INFINITÉSIMAL - Calcul à plusieurs 
variables, chap. 2) et que : 

(6) = f ( z o\ = if (?o) > 

d’où : 

(7) fÉ z ») + '1 É Zo) = a 
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Réciproquement, si / est une fonction 
dérivable des deux variables x et y satis- 
faisant à la condition (7), elle est dérivable 
au sens complexe. Si on pose 
/(.Y, y) = P(.Y, y) + /Q(; Y, y), la condition 
(7) donne les deux relations, appelées 
conditions de Cauchy-Riemann : 


<*>£«■•> -5?™ gw— gw- 


Si /est une fonction dérivable des deux 


variables 

réelles 

x, y 

, on pose 

souvent 

df 1/ 

( d_f_. 

df) 

df \( 

df ^ .df 

dz 2 ' 

\ dx 

dy ]’ 

dz 2 V 

dx+ l dy. 


ce qui est suggéré par l’expression de la 
différentielle : 


,, df, df. df J dfj_ 

df — — — dx + — —dy — — dz + -r-xlz^ 

ôx dy dz dz 


avec dz - dx + i dy et dz — dx — i dy. 
La condition de Cauchy-Riemann peut 
alors s’écrire : 



et on a, sif est dérivable au sens complexe : 

/Vo)=^o). 

Dans ce qui suit, on va montrer qu’une 
fonction / est analytique dans un ouvert U 
si et seulement si elle est continûment déri- 
vable au sens complexe dans U (cela signifie 
que f est une fonction continue dans U). 
D’après ce qui précède, cela revient à dire 
que f (z) est analytique si et seulement si 
/(.Y, )’) est une fonction continûment déri- 
vable des deux variables x, pqui satisfait, en 
tout point z — x - j- i)' de U, à l’une des 
conditions équivalentes (7) ou (8). 


Dérivation des fonctions analytiques 
Montrons tout d’abord que toute fonction 
analytique est indéfiniment dérivable au 


sens complexe et que sa dérivée est encore 
une fonction analytique. La dérivabilité et 
l’analyticité étant des propriétés locales 
(cela veut dire que si tout point U est 
centre d’un disque dans lequel ces proprié- 
tés sont vraies, alors elles sont vraies dans 
U), il suffit d’établir le résultat suivant : 

Théorème 3. Soit : 


w 


/(V 


= ^ a n {z — a)\ 


n - 0 


la somme d’une série entière dans un 
disque D (a, r) ; alors la fonction f est 
dérivable dans D (a, r), et on a : 


(**) f(z) = 'y na n {z—ay-'. 

fl = 1 

Remarquons tout d’abord que, puis- 
que : 

limvTî = 1, 

la formule d'Hadamard (3) montre que les 
séries entières (*) et (**) ont le même rayon 
de convergence. Par translation, on se 
ramène à a = 0. 

Soit Zq G D(0, r) et choisissons p tel que 
z o < p < /' ; désignons enfin par g(z) la 
somme de la série (**) pour z < r. On a, 
pour ; ^ Z 0 : 



l’expression entre crochets est nulle pour 
n = 1 et, pour n ^ 2, on peut majorer son 
module : 


n — 1 



kz 0 k — l z n — k — 1 
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pour z < p. Par suite : 

m=pû- tM 

Z — Zq 

X 

^Iz-ZolJV^p-; 

n = 2 

cette dernière série est convergente, puis- 
que p < r, etf‘est donc dérivable en z 0 , de 
dérivée /(j 0 ) = g(z 0 ). 

Puisque f est analytique, on peut lui 
appliquer de nouveau le théorème 3. Par 
récurrence, on obtient que f est indéfini- 
ment dérivable au sens complexe et que sa 
dérivée k-ième est : 


f”‘(z) 


OC 



n(n — 1 ) 

X (n-k 


+ 1 )a n (z — a) n ~ k , 


pour \z — a\ < r. Pour z = a , on a : 

f”‘(a) = k\a k - 


dans un disque D(a, r), la somme F(z) de 
la série entière : 


F(z) 


= Z«“TI (z ' 


-a)^ 


est une fonction analytique dans D(a, r) qui 
admetfpour dérivée au sens complexe ; on 
dira que c’est une primitive de f au sens 
complexe. On a ainsi établi que toute fonc- 
tion analytique possède localement une pri- 
mitive définie à une constante additive près, 
c’est-a-dire que tout point de l’ouvert U 
dans lequel U est analytique est centre d’un 
disque dans lequel J’ admet une primitive. 
Mais l’existence d’une primitive n’étant pas 
une notion locale, on ne peut rien obtenir de 
plus pour l’instant. Il sera nécessaire 
d’introduire une nouvelle notion, de nature 
topologique, la simple connexité (cf. infra , 
L homotopie, chap. 4), pour aborder globa- 
lement le problème des primitives d’une 
fonction analytique dans un ouvert. 


ainsi les coefficients a j. du développement 
(*) s’expriment simplement en fonction 
des valeurs des dérivées defau point a. Si 
f est une fonction analytique dans un 
ouvert U, son développement en série 
entière de centre a est : 

(9) /( z ) = — a )"’ 

n — 0 

dans un voisinage de tout point a G U ; 
c’est la formule de Taylor de f au point a. 
Cela redémontre, en particulier, l’unicité 
de ce développement en série entière de 
centre a . 

Il résulte du théorème 3 que, si : 


Analyticité des fonctions dérivables 

On se propose maintenant de montrer que 
toute fonction continûment dérivable (au 
sens complexe) dans un disque de centre a 
est somme dans ce disque d’une série 
entière. Avec le théorème 3, cela établira 
l’équivalence complète entre l’analyticité 
et la continue dérivabilité au sens complexe 
dans un ouvert U. Par translation, on se 
ramène à un disque ouvert de centre 0. 

Théorème 4. Soit f une fonction 
continûment dérivable (au sens complexe) 
pour z | < R; pour r < R, posons : 

(10) a n = A; f 2ïï f(re l ')e-‘’«dt. 

2 n. r n J 0 

Alors les nombres a, sont indépendants 
de r et on a : 


/(z)= y «.(*—«)- 

n = 0 


/(z) =^fa n z„, \z < R 

n — 0 
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Soit 2 E D(0, R) ; choisissons r tel que 
Z < /' < R. La fonction : 


‘ m - 1 


2 tt/[( 1— À)z + \re il ]— f(z) 


re ü dt 


est continue et dérivable pour 0 ^ X ^ 1 
(puisque, pour r fixé, la fonction sous le 
signe d’intégration est une fonction 
continûment dérivable de (t. A)), et sa 
dérivée s’obtient par dérivation par 
rapport à À sous le signe d’intégration. 
Ainsi : 


g’(h) = f 2 " /'[( 1 — A)z + \re‘ , ]re“dt = 0, 

J(0 

car la fonction sous le signe d’intégration 
est la dérivée (en î) de la fonction : 

F(t) = 4/[(l — À)z + Are"], 

lA 


qui est périodique de période 2tt, d’où 
g’(A) = F(2tt) F(0) = 0. Ainsi, g est 
constante dans [0, 1], donc nulle puisque 
g(0) = 0. Écrivant que g(l) = 0. on 
obtient, en sortant f (r) : 


(11) f(z)^' 


re iï 

re lt — z 


dt 



re i: 
re i! — 




Remarquons maintenant que, puisque 
/' > | r |, on a : 

( 12 ) ~ÏP~ 2 = 1 +*/"' 

+ {z/re'*) 2 + . . + (z/re iï ) n + ... . 

où cette série est normalement conver- 
gente pour t réel. On peut donc intégrer 
terme à terme, ce qui donne : 

( 13 ) 2 TT, 

J 0 re‘*—z 


puisque seul le terme constant a une 
intégrale non nulle. De même, f (re i{ ) est 
borné pour t réel ; on peut donc intégrer 


terme à terme son produit avec les deux 
membres de (12), ce qui donne, d’après 
(1 1), en tenant compte de (13) : 


m- 


Z û " z "’ 


les a n ayant la valeur indiquée par (10). Le 
fait que les coefficients a„ sont indépen- 
dants de r résulte de l’unicité du dévelop- 
pement en série entière. 

Donnons une autre conséquence du 
théorème 4. Si f est analytique dans un 
ouvert U, pour tout point a E U elle est 
continûment dérivable dans le plus grand 
disque ouvert de centre a contenu dans U, 
donc développable en série entière de 
centre G dans ce disque ; par suite, le rayon 
de convergence de la série de Taylor def 
en Cl est supérieur ou égal au rayon de ce 
disque, qui est la distance de fl à la frontière 
de U (cf. chap 7). 

Indiquons enfin qu’on peut établir le 
théorème 4 sous l’hypothèse plus faible 
que f est continue dans D(0, R) et déri- 
vable au sens complexe en tout point, sans 
supposer la continuité de /' (théorème de 
Goursat) ; la difficulté est alors de montrer 
que la fonction g(h) qui figure dans la 
démonstration est encore dérivable, de 
dérivée nulle. Cela entraîne que, si f est 
dérivable au sens complexe en tout point 
d’un ouvert U. alors / est analytique dans 
U (donc indéfiniment dérivable au sens 
complexe). 


3. Les coefficients 
de la série de Taylor 

La formule (10) qui donne une expression 
intégrale des coefficients du développe- 
ment en série entière va nous donner de 
précieux renseignements. 
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La propriété de moyenne 

Considérons tout d’abord le terme cons- 
tant de la formule de Taylor. On a, pour 
ïl = 0 dans (10) : 

par translation, on aurait, pour tout point 

«eu: 

( 14 ) fia) = ~ \ 2 * f (a + re i! )dî, 

2tt Jo 

pour tout r assez petit. Cette relation 
exprime que la valeur de f en a est égale à 
la valeur moyenne de f sur les cercles de 
centre a et de rayon r assez petit, ce qu’on 
exprime en disant que f possède la pro- 
priété de moyenne. Il est clair que la partie 
réelle et la partie imaginaire de f possèdent 
encore ces propriétés : ce sont des fonc- 
tions harmoniques (cf. potentiel et fonc- 
tions HARMONIQUES) . 

Le principe du maximum 

Une importante conséquence de la pro- 
priété de moyenne est le principe du 
maximum , que l’on peut énoncer ainsi : 
Soit U un ouvert connexe du plan com- 
plexe et f une fonction analytique dans U ; 
s’il existe un point a (z U tel que l’on ait 
1/ (~) ^ [/ ( a ) dans tout un disque de 
centre a (on dit alors que la fonction \f\ a 
un maximum relatif en a), alors / est 
constante dans l’ouvert U. 

Pour cela, remarquons d’abord que, si 
f(a) = 0, alors on a f(z) = 0 dans tout un 
voisinage de fl, d’ ou J = 0 dans U tout 
entier. Supposons donc f (a) # 0 ; multi- 
pliantfpar une constante complexe, on se 
ramène au cas où f (a) est réel positif. 
D’après le principe du prolongement ana- 
lytique, il suffit de montrer que f est 
constante dans un voisinage de a. 


Soit R tel que | f (z) ^ f ( U ) pour 

Z a < R, et limitons-nous à des valeurs 
r < R ; soit M(r) la borne supérieure de 
/(z) pour z = r. D’après l’hypothèse, on 
a donc M(r) ^ f (a). De plus, d’après la 
propriété de moyenne ( 14 ), on a 
f(u) ^ M(r) et, par suite, f(a) = M(r). 

Considérons la fonction u(z) qui est la 
partie réelle de f ( a ) ■ f ( z ) , soit 
u(z) = f (fl) Ref (z) ; on a u(z) ^ 0, 
puisque Re f ^ |/| et u(z) = 0 si et seu- 
lement si f (z) = f (a). Or U est la partie 
réelle d’une fonction holomorphe, donc 
possède la propriété de moyenne : sa 
moyenne sur le cercle z — a = r est égale 
à g(fl), donc nulle : 

J 2,r u(a + re i! )dt = 0; 

puisque u est continue ^ 0, cela entraîne 
ü(z) = 0, donc f(z) = f (a), dans tout le 
disque D(fl, R). 

Voici par exemple une conséquence du 
principe du maximum qui sert souvent. Si 
f est une fonction analytique dans un 
disque D(u, R), alors on a, pour r < R : 

(15) sup \f(z)\= sup |/0O |; 

I*— «I-' |*— a|<r 

en effet, la fonction continue |/| atteint sa 
borne supérieure dans D(0, r) en un point 
qui, d’après le principe du maximum, est 
nécessairement un point frontière, sinon / 
serait constante (et alors (15) trivial). Ce 
raisonnement s’appliquerait à tout com- 
pact (ensemble fermé et borné) du plan : 
si f est analytique dans un ouvert connexe 
D d’adhérence D compacte et continue sur 
D, alors |/| n’atteint son maximum qu’en 
un point frontière, sinon elle est constante. 
Donnons une application de (15) en éta- 
blissant le lemme de Schwarz , qui sert dans 
la théorie de la représentation conforme 
(cf. la partie C ci-après - Représentation 
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conforme) : Soit f une fonction analytique 
pour \z\ < 1 telle que /(O) = 0 et 

| f (z) < 1 pour \z < 1 ; alors on a 

| f(z) ^ z pour \z <1, avec égalité en 

un point z 0 ^ 0, si et seulement si 

f(z) = Àz, A constante complexe du 
module 1. 

En effet, on a : 


/(z)=^û„z», |z|< 


et, par suite, la fonction 




est analytique pour z <1. Puisque 
| f(z) < 1, on a donc |g(z) ^ 1/r pour 

Z = Y, et aussi pour z ^ r, d’après (15). 
Ainsi, fixant z E D(0, 1), on a \f(z) Ç Z jr 
quel que soit r > Z |, Y < 1 ; faisant tendre 
r vers 1 , on a bien \f(z) ^ | z |. Si mainte- 
nant on a |/(Zq) | = | Zq pour un point 
Zq ^ 0, alors la fonction g atteint son 
maximum en un point du disque D(0, 1) ; 
la fonction g est donc constante et on a 

= A,|À |= 1- 


tion est alors développable en série de 
rayon de convergence infini ; les inégalités 
(16) entraînent que les coefficients a n de ce 
développement vérifient : 



quel que soit r. Pour r tendant vers l’infini, 
on obtient a n ™ 0 pour n ^ 1. Le théo- 
rème de Liouville fournit une démonstra- 
tion extrêmement simple du « théorème 
fondamental de l’algèbre », le théorème de 
d'Alembert : Tout polynôme à coefficients 
complexes de degré ) 1 a au moins une 
racine complexe. En effet, soit : 

P(z) = a, + a x z + + a„_ x z"~ l + a n z n , 

où ^ 0, n ^ 1, un tel polynôme ; rai- 
sonnons par l’absurde, en supposant 
P(z) 0 pour tout z E C. La fonction 
i/p(.) est alors analytique dans tout le plan 
et bornée, car P(z) | — ► x pour z | — ► x ; le 
théorème de Liouville entraîne alors que 
cette fonction est constante, en contradic- 
tion avec l’hypothèse. 


4. Le problème des primitives 


Les inégalités de Cauchy 
Soit f une fonction analytique dans un 
disque D(0, R) ; la fonction j\z) est donc 
somme dans D(0, R) d’une série entière 
dont les coefficients a„ sont donnés par la 
formule (10). Si on désigne par M(r) le 
maximum de/(z) pour Z = r (c’est aussi, 
d’après (15), le maximum pour z < r), on 
obtient donc : 


Comme conséquence simple de ( 16 ), on 
obtient le théorème de Liouville : Une 
fonction analytique dans tout le plan et 
bornée est constante. En effet, cette fonc- 


Nous avons obtenu maintenant à peu près 
tous les résultats qu’il est possible de 
démontrer localement , c’est-à-dire à partir 
de l’étude des séries entières ; pour conti- 
nuer la théorie, nous avons besoin d’un 
remarquable outil introduit par Cauchy, 
l’intégrale curviligne le long d’une courbe. 

l’intégrale curviligne 

On va tout d’abord préciser la terminolo- 
gie et les conditions de régularité auxquel- 
les seront soumises les « courbes » du plan 
qui interviennent dans la suite. 

On appelle chemin dans le plan com- 
plexe toute application continue y : 1 — ► C 
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d’un intervalle I = [a, b] dans le plan 
complexe qui est continûment dérivable 
par morceaux ; cela signifie que I est une 
réunion d’un nombre fini d’intervalles 
fermés dans lesquels y est continûment 
dérivable, ou encore que y est la primitive 
d’une fonction continue par morceaux 
dans I, Le point y Ut) s’appelle V origine 
du chemin y et le point y {h) est son 
extrémité ; un chemin ferme, c'est-à-dire tel 
que y(u) = y(b) sera appelé un lacet. 
Enfin, on appelle trajectoire le SOUS- 
ensemble y(I) du plan complexe parcouru 
par y(/) pour / E I ; si y est un chemin, on 
le représentera géométriquement en des- 
sinant sa trajectoire et en indiquant par des 
flèches le « sens de parcours » du point y(t) 
lorsque t croît de a à b. L’exemple le plus 
simple d’une telle situation est celui d’une 
fonction affine par morceaux : la trajec- 
toire est alors une ligne brisée (cf. chap. 1). 
Soit maintenant n un entier relatif non nul, 
Zq un nombre complexe et r uil nombre réel 
positif; pour / E [0, 2 tt], l’application : 

f— z 0 + re linl 


ment dérivable par morceaux ainsi que la 
bijection réciproque, telle que yj (t) 
= y 2 (cp(/)) P our tout t £ l\. Par exemple, 
pour tout chemin, on peut trouver, par une 
homothétie suivie d’une translation, un 
chemin équivalent défini dans un intervalle 
fixe de R, par exemple [0, 1]. 

Soit maintenant y : [a, b] — ► C un 
chemin et f une fonction à valeurs com- 
plexes définie et continue sur la trajectoire 
de y. D’après les conditions de régularité 
imposées à y, la fonction t i— *./{y(0)yX 0 
est continue par morceaux, donc intégra- 
ble, dans [a, b]. On appelle intégrale 
curviligne le long du chemin y le nombre 
complexe : 

( 17 ) J/(0* = JVcr(r))r(»)rt; 

par exemple, si y est le cercle de centre r 0 
et de rayon r parcouru une fois dans le sens 
direct (cf. supra) et f une fonction continue 
sur ce cercle, on a : 

(18) f f(z)dz= f 2ir /(z 0 + re i! )ire‘ T dî. 

Jo 


est un lacet dont la trajectoire est le cercle 
de centre Zq et de rayon y (cf. EXPONEN- 
TIELLE et logarithme) . Nous dirons que 
ce lacet est ce cercle « parcouru n fois », 
car tout point de ce cercle est l’image de 
n valeurs distinctes de t E [0, 2tt] ; on 
dira aussi que c’est ce cercle parcouru une 
fois dans le sens direct si n = 1 et dans le 
sens rétrograde si n = — 1. 

Pour l’intégrale curviligne, nous aurons 
besoin d’une notion de courbe orientée plus 
« géométriquement », c’est-à-dire indépen- 
dante dans une certaine mesure du para- 
métrage y. Nous dirons que deux chemins : 

Ti : I: Y2 : L “ * C 

sont équivalents s’il existe une bijection 
continue cp croissante de 1, sur I 2 , continû- 


La notion d’équivalence des chemins 
introduite ci-dessus s’avère particulière- 
ment bien adaptée à l’intégrale curviligne ; 
en effet, la formule de changement de 
variable dans une intégrale montre que, si 
y, et y 2 sont des chemins équivalents et / 
une fonction continue sur leur trajectoire 
commune, les intégrales curvilignes de / 
sur y, et sur y 2 sont égales. 

Indiquons enfin comment on peut 
majorer une intégrale curviligne : si 
| f (z) ^ M pour tout point Z de la trajec- 

toire de y, on a : 


[ f(z)dz 


JVwOMO* 


« mJVoi*. 
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et cette dernière intégrale n’est autre que 
la longueur L(y) du chemin (cf. géométrie 

DIFFÉRENTIELLE CLASSIQUE) . Ainsi ! 


( 19 ) 



< ML(y). 


Lien avec les primitives 

Si la fonctionfest définie dans un ouvert 
U contenant la trajectoire de y et est dans 
cet ouvert la dérivée au sens complexe 
d’une fonction continue F (d’après ce qui 
précède, F est alors nécessairement ana- 
lytique), alors : 


/(y(O)y'(O 

est, sauf pour un nombre fini de valeurs de 
/, la dérivée de la fonction continue 
F(y(/)) ; par suite : 

(20) J7 (z)dz = F(7(6))-F( T (<7». 

En particulier, si une fonction /analy- 
tique dans un ouvert U admet une primi- 
tive (au sens complexe) dans cet ouvert, 
alors l’intégrale curviligne de f le long de 
tout lacet est nulle. Il est remarquable que, 
comme nous allons le montrer maintenant, 
cette condition est caractéristique : une 
fonction f analytique dans un ouvert 
connexe U admet une primitive dans U si 
et seulement si : 



pour tout lacet y dont la trajectoire est 
contenue dans U. 

Pour cela, remarquons tout d’abord 
que l’hypothèse (21) entraîne que, si y, et 
y 2 sont deux chemins de U de même 
origine et de même extrémité, alors les 
intégrales curvilignes de / le long de y, 


et de y-» sont égales. En effet, si nous 
désignons par y? I e chemin « opposé » à 
y 2 , c’est-à-dire le chemin y? « parcouru en 
sens inverse » (défini mathématiquement 
par : 


Y?(0 = Yz(^ + d—t) 

si y 2 : [f, d] — ► C), l’intégrale de la fonction 
/le long de y? est l’opposée de l’intégrale 
de /le long de y 2 . Le chemin obtenu par 
juxtaposition de y, et de y 2 , en parcourant 
« successivement » y l5 puis y 2 , est alors un 
lacet ; d’où, d’après (21) : 

o =[ f{z)dz + f f(z)dz 

J-ïi 

= f f(z)dz— f f{z)dz. 

WYi W7 2 

Pour j analytique dans U connexe 
satisfaisant à la condition (21), fixons 
un point a G U ; d’après ce qui précède, 
la valeur F(z) de l’intégrale curviligne de 
f le long d’un chemin y(z) de U d’origine 
ü et d’extrémité z est indépendante du 
choix de ce chemin (il existe au moins un 
tel chemin qui soit une ligne brisée, 
cf. SUpra , chap. 1, Principe t/fiS zéros isolés, 
car U est connexe). Montrons que F est 
une fonction analytique qui a pour dérivée 
f dans U ; soit z 0 un point de U. 11 existe 
un disque D(z 0 , a) dans lequel f est 
développable en série entière. Pour tout 
point z de ce disque, F(z) est l’intégrale 
curviligne de / le long de tout chemin de 
U d’origine a et d’extrémité z, par exemple 
le chemin obtenu en parcourant successi- 
vement un chemin y(z 0 ) d’origine a et 
d’extrémité z 0 ; d’où une intégrale curvi- 
ligne égale à F(z 0 ), puis le segment [z () , z], 
soit : 


F(z) = F(z 0 ) + /(Ç)rfC 
v[ z 0> z I 


413 



FONCTIONS ANALYTIQUES 



(fig. 2) ; or un calcul facile sur le dévelop- 
pement en série entière defdans D(z„ a) 
montre que : 


est une primitive de f dans ce disque. 

Remarquons que la condition (21) n’est 
pas toujours satisfaite. Par exemple la 
fonction f(z) = \jz est analytique dans 
l’ouvert connexe C* complémentaire de 0 
dans le plan complexe, et son intégrale le 
long du cercle | z | = 1 parcouru une fois 
dans le sens direct est : 



~ it ie it dt= 2 /tt 0 ; 


ainsi, cette fonction n’admet pas de pri- 
mitive dans C*. 

On voit ainsi que la recherche d’une 
primitive d’une fonction analytique 
dans un ouvert U est un problème qui n’a 
pas toujours de solution. Pour aborder 
cette question nous aurons besoin d’intro- 
duire de nouvelles notions de topologie du 
plan. En particulier, on va voir que, si U 
satisfait à une condition de nature géo- 
métrique : être « simplement connexe » 
(cf. infra , Théorème de Cauchy), alors 


toute fonction analytique dans U a une 
primitive dans U. 

L’homotopie 

Soit U un ouvert du plan complexe et y, et 
y 2 deux lacets de U ; quitte à remplacer 
l’un d’entre eux par un lacet équivalent, on 
peut supposer qu’ils sont définis dans le 
même intervalle I = [a, b] de R. On dit 
que ces deux lacets sont homotopes dans U 
s’il existe une application continue : 

cp : I x J-C, 

J = (c, d\ C R, telle que (p(/, c) = Yj(r), 
cp (t, d) = y 2 (/) pour tout t G I, et cp (a, u) 
= cp (b, u) pour tout u G J ; intuitivement, 
cela signifie qu’on peut « passer » de y, à 
y 2 , sans sortir de U, par une « famille 
continue » de courbes fermées C„ (de 
représentation paramétrique t (f(t, u)). 

Cette notion d’homotopie des lacets est 
fondamentale dans toute la théorie de 
Cauchy ; on définit ainsi une relation 
d’équivalence sur l’ensemble des classes de 
lacets équivalents (au sens ci-dessus). 

L’homotopie va permettre d’introduire 
une importante notion géométrique. On dit 
qu’un ouvert U du plan est simplement 
connexe si tout lacet de U est homotope 
dans U à un lacet constant, de trajectoire 
réduite à un point. Un exemple important 
est constitué par les ouverts étoilés pur 
rapport à un point ; cela signifie qu’il existe 
un point a d’un tel ouvert U tel que le 
segment [ a , z] soit entièrement contenu 
dans U pour tout z G U. C’est ainsi le cas du 
complémentaire dans le plan complexe 
d’une demi-droite fermée, si on prend pour 
a un point quelconque de la demi-droite 
opposée. Avec les notations précédentes, si 
U est un ouvert étoilé par rapport à a et si 
y : J — ► U est un lacet de U, l’application : 

cp : I x [0, 1] — U, 
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définie par : 

cp(f, u) = uy{t) + (1 — u)a, 

réalise l’homotopie de y sur le lacet cons- 
tant réduit au point a, car (p (t, 0) = y(7), 
q^(f, 1) = a ; on peut écrire : 

cpo, u) — a = u (y(t)—a), 

ce qui montre que cp(/, u) est homothétique 
de y(/) dans l’homothétie de centre a et de 
rapport u . 

Le théorème de Cauchy 
Ce résultat exprime que, si f est une 
fonction analytique dans un ouvert U, la 
valeur de l’intégrale curviligne defsur tout 
lacet de U ne dépend que de la classe 
d’homotopie de ce lacet dans U. En fait, on 
peut même montrer, ce qui est plus fort, 
qu’elle ne dépend que de la classe d’homo- 
logie (cf. infra, chap. 5, L'indicé) de ce 
lacet. D’après ce qui précède, ce résultat 
est intimement lié au problème de la 
recherche de primitives « globales » pour 
une fonction analytique. 

Théorème de Cauchy. Soit U un ouvert 
du plan complexe et f une fonction 
analytique dans U ; si y, et y 2 sont des 
lacets de U qui sont homotopes dans U, 
alors : 

f f(z) dz = f f(z) dz. 

En particulier, si U est simplement 
connexe, on a : 

J f(z) dz = 0 

pour tout lacet y de U ; par suite, toute 
fonction analytique dans un ouvert 
connexe et simplement connexe admet une 
primitive (au sens complexe) dans cet 
ouvert. 


Indiquons, sans entrer dans tous les 
détails, les grandes lignes d’une démons- 
tration de ce théorème. Soit, avec les 
notations ci-dessus : 

ip:P = [a, b] x [c, d] U, 

la fonction continue qui réalise l’homoto- 
pie. L’ensemble L = (jp(P) parcouru par 
q )(/, u) pour (f, u) Cl P est compact et inclus 
dans U (fig. 3 ; L est ombré). La compacité 

[ fig- 3 I 




Démonstration du théorème de Cauchy 


de L entraîne d’abord qu’il existe a > 0 tel 
que, pour tout point C L, la fonction / 
soit développable en série entière en 
(z — Zq) dans le disque D(z„ a) et, par suite 
(cf. supra, chap. 2, Dérivation des fonctions 


41 5 




FONCTIONS ANALYTIQUES 


analytiques ), admette une primitive dans 
ce disque. D’après la continuité uniforme 
de cp sur P. il existe alors £ > 0 tel que 
|f— f | < Z et II- u\ < E entraînent 
Cp(/, u) — q>(/', u’) < a/4. Soit mainte- 
nant : 

a = t 0 < ti < t 2 < < t n = b , 

c = u 0 < u l < u 2 < < u m = d , 

des subdivisions de [t/, 6] et [c, t/] respec- 
tivement telles que t, < e et 

Wy+ 1 u j < 6. Posons Zjj = Cp(/ Uj) et 
désignons par Ty la ligne brisée (fermée) 
joignant les points pour i croissant de 0 
à H (fig. 3) : cette ligne brisée peut être 
paramétrée par une fonction affine par 
morceaux et nous désignerons encore par 
T i le lacet ainsi défini. 

Soit A IJ l’intégrale curviligne de f le 
long du segment [z, Z/_|_] ■] et B ,-y l’inté- 

grale curviligne de f le long du segment 
[z i} -, Zjj_ |_j] (fig. 3). D’après le choix de e et 
de la subdivision, les quatre segments 
correspondant aux intégrales A ,y, A,„+„ 
B,- y, B /+ |y, sont dans un même disque 
où il existe une primitive F de f / on a 
donc : 

A w+I A ‘.y 

= ( F (z, + Wi) l)) 

(F(Zj+ l.j) — F(z,y)) 

= ( F ( Z , + I,; + l) — F ( z /+l,j)) 

— ( F ( Z i,/ + l) — F ( 2 i.j)) 

= B <+ I ,J — B, J. 

Additionnant les égalités ci-dessus pour 
ï = 0, 1, fl — 1. on fait disparaître les 
Byy et on obtient : 

f f(z)dz = f f(z)dz, 

Jr y+1 Jr, 

puisqu’il est clair que : 

i, nz)dz= X Au! 


un raisonnement très analogue montrerait 
que : 

f f(z)dz = f f(z)dz, 

Jr 0 Jri 

J r f( z ) dz = J f(z) dz, 
d’où le résultat cherché 

Le logarithme complexe 
Il résulte de ce qui précède que toute 
fonction analytique dans un domaine sim- 
plement connexe admet des primitives dans 
cet ouvert ; de plus, deux telles primitives 
diffèrent d’une constante au voisinage de 
chaque point (unicité du développement 
en série entière) et, par suite, dans l’ouvert 
connexe tout entier d’après le principe du 
prolongement analytique (cf. chap. 1, Prin- 
cipe des zéros isolés). Ainsi, le choix de sa 
valeur en un point détermine entièrement 
cette primitive. 

Voici une importante application de 
ce résultat. Si f est une fonction analyti- 
que dans un domaine simplement connexe 
U et ne s’annule pas dans U, la fonction 
/'//est dérivable, donc analytique, dans U 
et, par suite, admet des primitives dans U. 
Soit L l‘une d’entre elles, telle que l’on 
ait : 

e w=f(a) 

en un point a G U ; c’est toujours pos- 
sible, car f (a) ^ 0 et tout nombre com- 
plexe non nul peut se mettre sous la forme 

e h , t> ÇE C (Cf. EXPONENTIELLE ET LOGA- 
RITHME, chap. 4). La fonction analyti- 
que : 

g(z) = é> l ( z > 
a pour dérivée : 

g , (z) = L ’<?'*'*> =Q£g<?), 
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par définition de L. Ainsi : 

f\z)g{z) -f{z)g\z) — cl; 
divisant par (f(z)) 2 9^ 0, on a : 

/'(z)g(*)— /OQg'OO n 
(/ V )) 2 

ce qui exprime que la dérivée de la fonction 
f Ig est nulle dans U, et, par suite, que cette 
fonction est constante dans le domaine 
simplement connexe U. Cette constante 
est égale à 1, puisque f(a) = g(a ), et on a 
donc : 


g(z) = eUz) =f(z ), 

pour tout z G U. On dit que la fonction 
analytique L est une détermination analy- 
tique (en particulier continue) du loga- 
rithme de la fonction /. 

Notamment, il existe des détermina- 
tions analytiques du logarithme de z dans 
tout domaine simplement connexe ne 
contenant pas 0 (par exemple, dans le 
complémentaire d’une demi-droite fermée 
issue de 0) ; et deux quelconques de ces 
déterminations diffèrent d’un multiple 
entier de 2 717, mais on a vu plus haut qu’il 
n’existait pas de primitive de 1/z dans le 
plan complexe privé de 0 tout entier. Si L 
est une détermination du logarithme, sa 
partie imaginaire est une fonction continue 
qui est égale, en chaque point z, à une des 
valeurs possibles de l’argument de z. On dit 
que c’est une détermination continue de 
l’argument ; l’existence, dans un ouvert, 
d’une détermination continue arg z de 
l’argument équivaut à l’existence d’une 
détermination analytique du logarithme, 
par la formule : 

(22) L(z) = ln \z + i argz, 


analytique du logarithme, définie pour x 
non réel ^ 0, qui prend la valeur 0 pour 
Z = 1 ; la détermination correspondante 
de l’argument prend ses valeurs entre — TT 
et + TT et la détermination principale 
réalise une bijection du plan complexe 
privé du demi-axe réel négatif sur la 
« bande » formée des nombres complexes 
Z = X -f- /Y tels que TT < Y < + TT 

(cf. EXPONENTIELLE ET LOGARITHME, chap. 

4). Pour z réel positif, L(z) est le logarithme 
de z au sens usuel, et la série de Taylor de 
cette fonction au point 1 est : 


L(1 + z) 


+ r + 


+ (- 


z n 

-i)« + t - + 

n 


Le théorème de Morera 

Le théorème de Cauchy admet une réci- 
proque, qui ne fait intervenir que des 
intégrales curvilignes le long de contours 
fermés très simples : le théorème de 
Morera affirme qu’une fonctionfcontinue 
dans un ouvert U est analytique dans U si 
et seulement si son intégrale curviligne le 
long de tout rectangle, de côtés parallèles 
aux axes Ox et Oj, assez petit pour être 
entièrement contenu dans U est nulle. La 
condition nécessaire résulte du théorème 
de Cauchy ; indiquons le principe de la 
démonstration de la réciproque. Soit a un 
point quelconque de U et soit D un disque 
ouvert de centre ü entièrement contenu 
dans U ; pour z G D, désignons respecti- 
vement par A, M, P, Q les points d’affixes 
respectives : 


a — a -f i p, z — x + iy, 
x-MP, « + iy. 


où ln | Z est le logarithme du nombre réel 
positif z |. On appelle détermination prin- 
cipale du logarithme de z la détermination 


D’après l’hypothèse, les intégrales curvili- 
gnes defle long des deux chemins APM 
et AQM sont égales ; soit F(z) cette valeur 
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commune. On vérifie facilement que F 
admet dans D des dérivées partielles qui 
sont : 


d¥ . ÔF 
dx dy 


d’après les conditions de Cauchy- 
Riemann (6) ou (7), la fonction F est donc 
analytique, de dérivée au sens complexe /. 
Ainsi la fonction /, qui est, au voisinage de 
chaque point, la dérivée d’une fonction 
analytique, est analytique dans U. 

Le théorème de Morera peut servir à 
éliminer des « fausses » singularités. Par 
exemple, désignons par P + et par P - les 
demi-plans ouverts Imz > 0 et Imz < 0 ; 
si f est une fonction continue dans un 
ouvert U qui est analytique dans chacun 
des ouverts U Pi P + et U H P - , alors /est 
en fait analytique dans U tout entier. Il 
suffit de montrer que l’intégrale de j le long 
de tout rectangle de côtés parallèles aux 
axes est nulle et le seul cas où une 
démonstration est nécessaire est celui où 
ce rectangle ABCD coupe l’axe réel, c’est- 
à-dire rencontre à la fois P + et P - ; 
bornons-nous à de rapides indications 
géométriques. Introduisons, comme l’indi- 
que la figure 4, les segments opposés PQ 
et RS, parallèles et à une distance £ de l’axe 
réel. Puisque f est analytique dans P + et 
dans P - , les intégrales curvilignes de / le 
long des lignes brisées QABP et SCDR 
sont respectivement égales aux intégrales 
curvilignes defle long des segments PQ et 
RS. La continuité de /entraîne alors que, 
lorsque £ tend vers 0, les intégrales de /le 
long de PS et de RQ tendent vers 0, tandis 
que les intégrales le long des segments PQ 
et RS tendent vers des valeurs opposées 
(fig. 4). A ia iimite, on obtient bien que 
l’intégrale de /le long du rectangle ABCD 
est nulle. 



Le résultat qui précède permet d’établir 
le principe de symétrie de Schwarz, utilisé 
pour prolonger des fonctions analytiques 
(cf. la partie B ci-après Fonctions ellip- 
tiques et modulaire). Soit U un ouvert 
connexe symétrique par rapport à une 
droite L ; désignons par V l’intersection de 
U avec un des demi-plans fermés détermi- 
nés par L et par U] l’intersection de U avec 
le demi-plan ouvert correspondant. Alors, 
toute fonction / continue dans V, analyti- 
que dans U, et telle que j (U fl L) C L’, où 
L’ est une droite, se prolonge (de manière 
unique car U est connexe) en une fonction 
analytique dans U tout entier (en faisant 
correspondre à des valeurs de z symétri- 
ques par rapport à L des valeurs de j (z) 
symétriques par rapport à L’). En effet, par 
des transformations affines portant sur Z et 
surf(s), on peut toujours se ramener au 
cas où L et L’ sont l’axe réel, U symétrique 
par rapport à l’axe réel, U, = U 11 P+ et 
/ (z) réel pour :EU HR. Il suffit alors de 
remarquer que la fonction g définie dans U 
tout entier par : 

g(z) =/(z), zeunp+, 

g(z) =/(z), z EU n P-, 
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est continue dans U et analytique dans 
chacun des ouverts U D P + et U fl P - ; 
remarquons que g prend des valeurs symé- 
triques par rapport à l’axe réel en des 
points symétriques par rapport à l’axe réel. 


5. La formule intégrale de Cauchy 

Cette formule donne les valeurs d’une 
fonction analytique, sous forme d’une 
intégrale curviligne ; en particulier, elle 
traduit le fait que les valeurs d’une fonction 
analytique à F« intérieur » d’une courbe 
sont déterminées par les valeurs prises sur 
la courbe. Nous aurons tout d’abord 
besoin de préciser une notion de caractère 
géométrique, le « nombre de fois » où une 
courbe fermée « tourne » autour d’un 
point. 


L’indice 

Soit y : 1 = [a, b] — ► C un lacet et soit Q 
le complémentaire de la trajectoire y(I) de 
y. Pour tout z G Q, on appelle indice du 
point z par rapport au lacet y le nombre : 


(23) 


J(r, y) = 


2 /tt 


i 


dÇ , 

C— z* 


montrons que /(z ; y) est toujours un entier 
relatif. Pour z G O fixé, posons : 



de telle sorte que j(z ; y) = h(b)j 2 il T, par 
définition de l’intégrale curviligne le long 
de y. Puisque e n = 1 si et seulement si 
w/2 nr est un entier (cf. exponentielle et 

logarithme, chap. 4), il suffit d’établir que 
ç h(b) = [ 

Posons : 


g(0 = z ); 


puisque : 


A -(0 = . 7 T ' f > . 

Y(0— z 

sauf en un nombre fini de points, on a : 

g’(f) = — z)e~ h «) 

+ f(t)e~ h ^ = o, 


ce qui montre que la fonction continue g 
est constante, sur [a, h]. En particulier, 
g(u) = g(b), d’où, puisque h(a) = 0 : 

— z) - y (a) — 2; 


or y(h) = y(tf), car y est un lacet, ce qui 
établit le résultat. 

La formule (23) montre facilement que, 
pour y fixé, la fonction z •— 1 ► j(z ; y) est 
continue dans Q ; puisqu’elle ne prend que 
des valeurs entières, elle est donc constante 
dans chaque composante connexe de Q, 
D’autre part, si y, et y 2 sont deux lacets 
homotopes dans le complémentaire de z, il 
résulte du théorème de Cauchy que 
ji- ; Tl Y 2). puisque Ç 1 /(Ç :) 

est analytique dans C — {z} ; en particu- 
lier, si la trajectoire de y est contenue dans 
un ouvert simplement connexe U, on a 
j(z ; y) = 0 pour tout Z G U. Il en résulte 
que./(r ; y) = 0 pour z assez grand et par 
suite dans toute la composante connexe 
non bornée de Q = C-y(I). Si y : 
t | — 1 - e mt , tj G Z f est le cercle unité parcouru 
n fois, on a : 


7(0 ; Y) : 


. j_ r df 

2/ TT Jy C 

L f*» e 

iTT Jo 


= J 
2 1 


u ine int di - 


et par suite y(z ; 7) —Yt pour |z| < 1, 
puisque le disque unité est connexe ; puis- 
que l’extérieur du disque unité est connexe, 
on a /(z ; y) ™ 0 pour z > 1 , De manière 
générale, l’indice exprime le nombre alge- 
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brique de fois où le point y(t ) « tourne » 
autour de z lorsque î croît de a à b. Par 
exemple, sur la figure 5, on T àj(u ; y) = 1, 
j(v ; y) = 3, j{w : y) = 2. 



La notion d’indice permet, en intro- 
duisant une nouvelle définition, de défi- 
nir le cadre exact du théorème de 
Cauchy. Soit U un ouvert du plan ; on 
dira que deux lacets y et y’ sont 
U-homologues si tout point du complé- 
mentaire de U a le même indice par 
rapport à ces deux lacets. Intuitivement, 
cela exprime que y et y’ « tournent » le 
même nombre de fois autour de tout 
point du complémentaire de U. On voit 
alors facilement que deux lacets homoto- 
pes dans U sont a fortiori U-homologues. 
Le théorème de Cauchy, sous sa forme la 
plus générale, que nous admettrons, 
affirme que, si y et y’ sont U-homologues, 
alors : 


f f{z)dz = f f{z)dz 

vy' 

pour toute fonction f analytique dans U. 


Formule intégrale de Cauchy 
Soit y un lacet dans un domaine simple- 
ment connexe U ; la formule intégrale de 
Cauchy exprime que, pour toute fonction 
f analytique dans U, on a : 

( 24 ) 


pour tout point 1 de U n’appartenant pas 
à la trajectoire de y. 

En effet, on voit facilement sur le 
développement en série entière de / au 
voisinage de z que la fonction g définie 
par : 

' g ( 0 = /(C) r ~~ /(z) pour ç* z, 

s Z 

.£(*) = /'( z ) 


est analytique dans un voisinage de z, et, 
par suite, dans U tout entier. D’après le 
théorème de Cauchy (cf. chap. 4), l’inté- 
grale curviligne de g le long de y est donc 
nulle ; soit, puisque z n’appartient pas à la 
trajectoire de y : 


o = f/(Ç)-/( z ), c 

h z 

-*&«-/*> j;& 


r) 


La formule de Cauchy est particulière- 
ment intéressante lorsque y est un cercle 
parcouru dans le sens direct ou rétrograde, 
car alors /(z ; y) = -h I ou 1 pour tout 
point z intérieur à ce cercle. 

La formule (24) exprime les valeurs 
d‘une fonction analytique en fonction de sa 
restriction à la trajectoire d’un lacet y, qui 
est une fonction continue sur cette trajec- 
toire. Réciproquement, on peut définit 
ainsi des fonctions analytiques. Plus pré- 
cisément, soit y : I — » C un chemin (on ne 
suppose pas qu’il est fermé) et soit f une 
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fonction continue sur la trajectoire y(l) ; 
alors la fonction : 

(25) g(z) = f P^- du 

t ly U Z 

est analytique dans l’ouvert complémen- 
taire de y(l). La démonstration consiste à 
établir, par des majorations au voisinage de 
chaque point, que l’on peut dériver (au sens 
complexe) sous le signe d’intégration, ce qui 
entraîne l’analyticité ; ainsi, la dérivée 
n-iéme au sens complexe est donnée par : 

(26) gc>fr).n! f - / ^ - ■ du, 

J T (a— z) n + ' 

obtenu en dérivant n fois par rapport à Z. 
En particulier, si f est analytique dans un 
ouvert simplement connexe U, on a, en 
combinant les deux résultats précédents : 


converge uniformément sur tout compact 
vers une fonction f si tout point a G U est 
centre d’un disque fermé A inclus dans U 
sur lequel la suite (f n ) converge uniformé- 
ment vers f c’est-à-dire : 

II/— /J = $Up|/(z)— f n (z)\ 

A zE A 

tend vers zéro pour n tendant vers l’infini. 
On peut alors affirmer (théorème dû à Karl 
Weierstrass) que la fonction limite f est 
analytique dans U ; de plus, la suite (f' n ) 
des dérivées converge uniformément sur 
tout compact vers la dérivée f de f Soit 
en effet D(tf, r) un disque fermé de centre 
a sur lequel la convergence est uniforme, 
et soit y le cercle frontière z — a | = r 
parcouru une fois dans le sens direct. 
D’après la formule de Cauchy, on a : 


(27) j(z;yV(")(z) 


n ! f 
2/tt J 7 


fÿO 

(i u — z) n + 1 


du, 


pour tout lacet y de U et tout z E U 
n’appartenant pas à la trajectoire de y. 


Suites convergentes 
de fonctions analytiques 
Dans le domaine réel, une limite uniforme 
de fonctions dérivables n’est pas nécessai- 
rement dérivable ; en fait, le théorème de 
Weierstrass affirme même que toute fonc- 
tion continue sur un intervalle borné [a, b] 
est limite uniforme de polynômes (cf. 
représentation et approximation des fonc- 
tions) . Mais, dans le cas complexe, la 
situation est tout à fait différente, et la 
formule intégrale de Cauchy permet 
d’obtenir des conditions très fortes de 
régularité par passage à la limite. 

La notion de convergence appropriée 
ici est la « convergence uniforme sur tout 
compact ». Soit j\, />, . . f m une suite de 
fonctions analytiques dans un ouvert U du 
plan complexe ; on dit que la suite (f n ) 


f — \ f ~du, 

2jtt u — z 


pour z ü < r. Puisque les fonctions (f n ) 
convergent uniformément vers f sur le 
cercle z — a = r , un passage à la limite 
dans l’intégrale montre que : 



/(«) 


du, 


ce qui établit, d’après (25), que f est 
analytique. Partant maintenant de : 


fn<?) = 


— \ IÆL.u, 

2 / TT J f ( U Z) 2 


une majoration facile de \j(u — z) 2 montre 
alors qu cf ' n converge uniformément dans 
tout disque I z — a ^ r’, r’ < y, vers : 


1 f f(u) 

2/ TT j -y (l/ 


du ~f\z). 


Les résultats précédents permettent de 
définir des fonctions analytiques à partir de 
séries ou de produits infinis de fonctions 
analytiques ou encore d’étendre (25) à des 
« chemins sans fin » (cf. fonction gamma) . 
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6. Points singuliers isolés et résidus 

On se propose ici, dans une première appro- 
che vers les points singuliers, d’étudier le 
comportement d’une fonction analytique 
dans un disque pointé 0 < z — a < r, 
c’est-à-dire dans un disque ouvert privé 
de son centre ; si / ne se prolonge pas en 
une fonction analytique dans le disque 
entier, on dira que a est un point singulieî 
(isolé) pour f. 


La série de Laurent 

Un disque pointé 0 < \ z — a < r est un cas 
particulier d’une couronne ouverte 
r, < | r — a | < r~) ; on va obtenir pour une 
fonction analytique dans une telle couronne 
Sun développement en série généralisant le 
développement en série entière de centre a , 
valable seulement pour les fonctions analy- 
tiques dans tout un disque de centre ü . 

Il nous faut d’abord étendre la formule 
de Cauchy qui n’est pas applicable direc- 
tement, puisque S n’est pas simplement 
connexe. Soit r et r' tels que 
/q < r < f < r 2 et soit y et y’ les 
cercles de centre a et de rayons Y et r' 
parcourus une fois dans le sens direct 
(fig. 6). On voit comme ci-dessus que, pour 
r < r — (I < r', la fonction g définie par : 


g(z) =/'(z) 


pour u 7 e z, 


est analytique dans S. Puisque les lacets y 
et y’ sont manifestement homotopes dans 
S, le théorème de Cauchy (cf. chap. 4j 
affirme que les intégrales de g le long de y 
et y’ sont égales. On a donc : 




Développement en série de Laurent 


d’où, puisque j(z ; y) = î, j{z ; y’) = 0, 


< 2S > ■'V-è-.iBr/- 


Z- f ^du 

2inJyU — z 


qui généralise (24). 

Remarquons alors que (en suppo- 
sant, dans le calcul qui suit, a = 0 pour 
simplifier, ce qui ne retire aucune géné- 
ralité), d’après le choix de z, r < [z < r', 
la série : 


1 


u — z 




converge uniformément pour u — r\ car 
alors u/z j = \z \jf < 1 ; on peut donc 
intégrer terme à terme sur y’ et on obtient : 


(29) 



î 

n — 0 


a n z n , 


avec : 


(30) 


1 f /(“> 

a, = — — vt “ u > 

2l TT Jy u tt + 1 


en fait, ces coefficients a n ne dépendent pas 
de r', car la fonction /(w)/w ,î+1 est analy- 
tique dans S et, par suite, d’après le 
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théorème de Cauchy, on peut remplacer y’ 
par n’importe quel cercle concentrique 
(contenu dans S) parcouru dans le sens 
direct, puisqu’il est homotope à y’. Ainsi la 
série entière définie dans (29) converge 
pour tout z de module < r 2 ; donc elle a un 
rayon de convergence ^ r 2 et, par suite, f\ 
se prolonge en une fonction analytique 
pour z| < r 2 (que nous désignerons 
encore par f { ). Remarquons qu’on aurait 
pu obtenir le résultat qui précède sans 
développer \j(u — z) en série : d’après 
(25), la fonction f\ définie par l’intégrale 
(29) est analytique pour Z < r' \ d’après 
le théorème 4 du chapitre 2 elle est donc 
développable en série entière et les inté- 
grales (10) ne sont autres que des intégrales 
curvilignes du type (30) que l’on a expli- 
citées en revenant à la définition. De 
même, la série : 


1 


u — z 




i + + ^ 

z z 


+ 



converge uniformément pour u |=r < z | ; 
on peut donc l’intégrer terme à terme sur 
y et on obtient : 


une couronne < \z — a < r 2 \ toute 
fonctionf analytique dans S peut s’écrire : 


(31) f(z) 


=2 


(z—aY 


^ a„(z— a)" 

n = 0 


où la première série converge pour z — CI 
> Y, et la seconde pour z — a < r 2 ; leurs 
sommes sont donc des fonctions analyti- 
ques pour | z a > T| et Z — a < r 2 res- 
pectivement. Pour tout n entier relatif, les 
coefficients a n sont donnés par : 


(32) 


“n 


_L f JJü 1ÊL., 

2/tt J 7 (u — a) n + l 


n£z, 


où y est un cercle quelconque de centre a 
et de rayon r, r l < r < r 2 , parcouru une 
fois dans le sens direct. 


Points singuliers 

Soit f une fonction analytique dans un 
disque pointé 0 < z — a < r. Un tel dis- 
que pointé étant un cas particulier de cou- 
ronne, / admet un développement du type 
(3 1). Remarquons qu’ici la série entière : 

«(0 = 

n ~ 1 


n — 1 

avec : a_ n = f u n ~ ] f(u)du 

2/7T J'y 

= _Lr ÆL du . 

2/7rJ,«-’ + 1 ’ 


converge pour tout t (= C ; u est donc une 
fonction analytique dans tout le plan telle 
que u( 0) = 0. On dit que : 


(33) 




1 


’(z — a) n 


par le même raisonnement que ci-dessus, 
on voit alors que ces coefficients ne dépen- 
dent pas de r pour rj < r < r 2 et que la 
série de terme général a_ n t n est conver- 
gente pour z > Sa somme, que nous 
désignerons encore par / 2 , est donc une 
fonction analytique pour z > V\. 

Revenant au cas d’un point a E C, 
énonçons les résultats précédents. Soit S 


est la partie singulière de la fonction f au 
point a. D’après (3 1), la fonctionfest donc 
somme de sa partie singulière et d’une 
fonction analytique dans tout le disque 

\z-a\<r. 

Si u — 0, la formule (31) montre quef 
est somme d’une série entière pour 
| z — a | < r et, par suite, se prolonge par 
continuité en une fonction analytique dans 
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tout ce disque : a n’est pas un « vrai » point 
singulier ; on dit que c’est un point régulier. 
Pour U ^ 0, on dit que a est un point 
singulier isolé. 

Si u est un polynôme de degré ni ^ 1 , on 
dit que a est un pôle d’ordre m. Remar- 
quons qu’ alors la fonction (z a) m j (z) se 
prolonge en une fonction h analytique dans 
le disque z fl < r et que : 


/(O = 


h (z) 

(z — a) m ’ 


h (a ) ^ 0 ; 


cela entraîne que | f (z) — ► oo pour z — > Cl. 
Plus généralement, si f et g sont analyti- 
ques dans un voisinage de a avec f ( â ) ^ 0 

et fl zéro d’ordre m de g (cf. cliap. 1), alors 
f/g a un pôle d’ordre ni en a, car on peut 
écrire g(2) = (z fl) m /î(z ), avec h(z) ^ 0, 
d’où fjh est analytique, dans un disque de 
centre fl . Ce qui précède conduit à la 
notion de fonction méromorphe : Soit U 
un ouvert du plan et P un sous -ensemble 
fermé de U dont tous les points sont isolés ; 
on dit qu’une fonction analytique dans 
U P est méromorphe dans U si les points 
de P sont des points réguliers ou des pôles 
(on peut d’ailleurs se ramener à ce seul cas 
en prolongeant F par continuité aux points 
réguliers ; P est alors l’ensemble des pôles 
de la fonction méromorphe). Remarquons 
que cela revient à dire que tout point de U 
est centre d’un disque pointé inclus dans U 
dans lequelfest quotient de deux fonctions 
analytiques dans le disque tout entier. 

Examinons enfin le cas où il existe une 
infinité d’entiers positifs n tels que a_ n ^ 0 ; 
on dit alors que fl est un point singulier 
essentiel. Par exemple, la fonction : 


théorème plus élémentaire de Weierstrass, 
décrit le comportement d’une fonction 
analytique autour d’un point singulier 
essentiel : Si fl est un point singulier 
essentiel pour une fonction /, alors, dans 
tout disque pointé de centre a, la fonction 
/ prend toutes les valeurs complexes, sauf 
au plus une ; par exemple, la fonction e ] ‘ z 
prend toutes les valeurs sauf 0 dans tout 
disque pointé de centre 0. 

Le théorème des résidus 

Soit U un ouvert et flj, fl 2 , . . . . a n des points 
distincts de U. Si f est une fonction 
analytique dans U’ = U {a ,, fl 2 , . . . . fl,,}, 
désignons par Vj, v 2 , . . . . v„ les parties 
singulières de f en a„ fl 2 , . . . . a n respecti- 
vement ; ainsi, la fonction est analytique 
dans le plan complexe privé du point cij.. La 
fonction : 


g =/— (v i + v 2 + ... + v„) 

est alors analytique dans U’ et sa partie 
singulière en chacun des points a ^ est 
nulle ; elle se prolonge donc en une fonc- 
tion, que nous désignerons encore par g, 
analytique dans U tout entier. Si U est 
simplement connexe, le théorème de Cau- 
chy affirme que l’intégrale de g le long de 
tout lacet y est nulle, soit, si aucun des fl^ 
n’appartient à la trajectoire de y : 

(34) f/(z)flz=V f v k (z)dz ; 

V f JL— 4 VT 

k = 1 

ainsi, pour calculer l’intégrale de f il suffit 
de calculer les intégrales des v*. Effectuons 
ce calcul. Soit donc : 


-f _L 

/ 4 n !z" 


+ 1 , z^O, 




a-n^ n 


admet 0 pour point singulier essentiel. Un une fonction analytique dans tout le 

théorème dû à Émile Picard, précisant un plan et y : I — ► C un lacet dont la trajec- 
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toire y (I) ne contient pas un point a ; la 
série : 

V(z) = ^ a_„(z—a)~ n = ) 

n = 1 

converge uniformément pour z = y(t ), 
t G I, et, par suite, on peut intégrer terme 
à terme cette série sur le lacet y. Or, pour 
U ^ 2, la fonction (" a)~ n admet une 
primitive (1 — n)(z — a) l ~ n dans C — {a} 
et, par suite, son intégrale le long de y est 
nulle ; il reste seulement le terme en 
1 /(z Ci ), qui introduit l’indice du point a 
par rapport au lacet y : 


Un exemple de calcul 

La formule des résidus permet le calcul 
explicite de nombreuses intégrales. Don- 
nons un exemple en calculant la transfor- 
mée de Fourier de la fraction rationnelle 
R(y) = 1 / (.V“ + a’), où a est un nombre 
complexe de partie réelle >0. Il s’agit 
donc de calculer l’intégrale : 

R(u) = f +œ R(x)e- 2i ™dx, u €R. 

J 00 

Considérons la fonction : 


(36) F(z) = 


q — 2 1 ir uz 


z 2 + a 2 


q — li nuz 

(z — ia)(z -f ia) ’ 


I"(^)‘ /2 = 2, ' 7ra - ,y(û;r) - 

On voit donc l’importance du coeffi- 
cient de 1 j(z — ü) dans la partie singulière 
au point a ; on l’appelle le résidu de f au 
point a, et on le note Res ( a ; f), Ce qui 
précède permet d’énoncer le théorème des 
résidus sous sa forme générale : Soit U un 
ouvert simplement connexe et c/j, a n des 
points distincts de U ; pour toute fonction 
f analytique dans : 

U' = U 

et tout lacet y de U’, on a la formule des 
résidus : 

n 

(35) J f(z)dz = lin Res 

k = 1 

Cette formule est encore valable lors- 
que /est une fonction méromorphe dans 
l’ouvert simplement connexe U ; soit P 
l’ensemble des pôles de / Comme P n’a 
que des points isolés dans U, pour tout 
lacet y de U — P, l’ensemble des a G P tels 
que j(ü ; y) 0 est fini. Dans ces condi- 
tions, on a : 

(35’) J f{z)dz = 2 /tt j (a ; y) Res(a ;/). 

T Tëp 


qui est méromorphe dans tout le plan et 
admet ia et ia comme pôles d’ordre 1 . 
Calculons les résidus en ces points. 

De manière générale, si F(z) = 
P(z)/Q(z), où P et Q sont analytiques dans 
un disque de centre /;, P(h) 7 ^ 0 et h racine 
simple de Q, on a vu que : 


où a_j est le résidu de f en h et h holo- 
morphe au voisinage de b. Par suite, on a : 


Res(6;F) = lim(z-6)^ 


= lim P(z) 

z — b 


z — b 

QOO — Q») 


?(bj 

v&y 


puisque Q(h) = 0. Dans notre cas, on a 
donc, F étant la fonction (36) : 


Res (ia ; F) 
Res ( — ia ; F) 


£ 2nua 

lia 

£ — 2 nua 

lia 


Dans le calcul qui suit, on est alors 
amené à distinguer deux cas, suivant que 
U ^ 0 ou u ^ 0. Pour u ^ 0, appliquons 
la formule des résidus à l’intégrale de F le 
long du lacet constitué par le segment 
[- R, R] de l’axe réel et par le demi-cercle 
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T r de centre 0 et de rayon R, R > Cl |, du 
demi-plan inférieur (fig. 7). L’indice de ia 

fig 7 

y 




_ . , f + ^ o 2iTXU 

Calcul de JL _ dx, Rea > 0, ue R 

J - ac x 2 + a 2 

est égal à 0 et l’indice de ia est égal à 1. 
On a donc : 


(37) £ 


R x 2 4- a 2 


dx + f F(z) dz 

" “ R 

= — 2/7T Res ( — ia ; F) 
ir 

— _ £> — 2irau . 

a 


or, sur T r , on a : 


|F(z)K 


e 2 ™)* | 1 

z 2 + a 2 r R 2 -û 2 ’ 


car e v+,v | = et < 0 ; la majoration 
(19) montre alors que l’intégrale de F le 
long de r R tend vers 0 quand R tend vers 
l’infini, puisque : 


F(z) dz 

K 


^ ttR 
^ R 2 — a 2 ’ 


d’ou, par passage à la limite dans (37) : 


dx = e ~ 

J_oo x 2 4- a 2 a 


u > 0. 


Pour u ^ 0, on intègre sur le lacet 
constitué par le segment [-R, R] et le 
demi-cercle T' R orienté comme l’indique la 
figure 7. L’indice de ia est cette fois égal à 
-F 1, tandis que l’indice de — ia est nul. On 
voit, comme ci-dessus, que l’intégrale cur- 
viligne de F le long de T' R tend vers 0 pour 
R tendant vers l’infini et on obtient : 


f(u)= r F(x )dx — lin Res (ia ; F) 

TT | 

= -e 2 ™\“ I , u C 0. 

a 


En résumé, on a donc : 

/(«) = «ÊR. 


Compteur logarithmique 

Soitf’une fonction méromorphe non nulle 
dans un ouvert simplement connexe U, soit 
N l’ensemble de ses zéros et P l’ensemble de 
ses pôles. Alors f'jf est une fonction méro- 
morphe dans U et ses pôles, qui sont tous 
simples, sont les éléments de N U P. 

En outre, si a G N, on a : 

Res (a ;/) = n a , 

où n a est la multiplicité du zéro a , et, si 
bE P, 
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Re $ (b ;/)= ~n b , 

où n fj est la multiplicité du pôle b. 

La formule des résidus, appliquée à la 
fonction /'// montre que, pour tout lacet 
y de U (PU N), on a : 

À!/®* = Z ;(a : Y>, *-Z y<6 ; 

C’est pourquoi cette fonction s’appelle 
compteur logarithmique des zéros et des 
pôles de / 

En particulier, si /est holomorphe dans 
U et si y est le bord d’un disque contenu 
dans U — N : 


1 

27tt 


' f( z ) 

ï/(z) 


dz - 


z 




où R f est l’ensemble des zéros intérieurs au 
disque. 

Cette formule permet en particulier de 
déterminer le nombre de zéros d’un poly- 
nôme, comptés avec leur ordre de multi- 
plicité, contenus dans un disque donné. 

Comme le compteur logarithmique 
dépend continûment des coefficients du 
polynôme, on en déduit que les racines 
d’un polynôme dépendent continûment 
des coefficients de ce polynôme (théorème 
de Weierstrass). 

De manière semblable, on peut utiliser 
le compteur logarithmique pour établir des 
propriétés du spectre d’un endomor- 
phisme d’un espace vectoriel de dimension 
finie sur C (continuité des racines du 
polynôme caractéristique). 


7. Prolongement analytique 

On se propose d’étudier ici la possibilité de 
prolonger une fonctionf’ analytique dans un 
ouvert U à un ouvert plus grand. Pour tout 
point G. (z U, la série de Taylor de /en a 


converge dans le plus grand disque ouvert 
D contenu dans U (cf. chap. 2) ; mais, 
comme on l’a déjà signalé ci-dessus, il se 
peut fort bien que le disque de convergence 
A de cette série « déborde » de U. La 
somme de la série dans A est alors une 
fonction analytique dans A qui. d’après le 
principe du prolongement analytique (cf. 
chap. 1). coïncide avec /' dans la compo- 
sante connexe de U fl A qui contient D. 
Cependant, si U Pi A n’est pas connexe, on 
ne peut pas affirmer en général que / se 
prolonge en une fonction analytique dans 
U U A. Prenons pour exemple, pour U, le 
plan complexe privé des nombres réels 
négatifs ou nul U = C R" et, pour/ la 
détermination principale du logarithme (cf. 
chap. 4). Pour z 0 = x 0 + iy 0 , ,v 0 < 0, 
y () > 0, le disque de convergence de la série 
de Taylor de ln z en z 0 est le disque de centre 
Zq qui passe par 0, car la dérivée 1 /z de ln Z 
est analytique dans C* = C {0} (fig. 8). 
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Ici A fl U a deux composantes connexes et 
la somme de la série de Taylor en z 0 n’est pas 
égale à f (z) pour Z EA D U, Im z < 0, car 
Im (ln z) = Arg z subit une discontinuité 
en « traversant » R D A, ce qui exclut la 
possibilité de prolonger f à U U A. L’exa- 
men de ces phénomènes a priori surpre- 
nants conduit à des extensions de la notion 
de fonction analytique et aux surfaces de 
Riemann. Pour éviter des difficultés du type 
précédent, nous raisonnerons ici sur des 
disques, car l’intersection de deux disques 
est toujours connexe. 

Points singuliers et points réguliers 

Soit f une fonction analytique dans un 
disque ouvert D ; on dira qu’un point fron- 
tière u est un point régulier pour / s’il existe 
un disque ouvert D, de centre U et une 
fonction g analytique dans D, qui coïncide 
avec /dans D U D,. On peut alors prolon- 
ger f en une fonction analytique dans 
D U D„ d’après le principe du prolonge- 
ment analytique. Dans le cas contraire, on 
dit que u est un point singulier pour f. Il est 
clair que les points réguliers forment un 
ouvert de la frontière de D. 

Remarquons que le fait, pour w, d’être 
un point régulier ou singulier n’a rien à 
voir avec la nature de la convergence de la 
série de Taylor de /‘en U. Par exemple, 

/(z) = l + z + z 2 + + z n + ... = » 

pour z < U est analytique dans D(0, 1), 
et tous les points du cercle z = 1 . sauf le 
point z — 1. sont des points réguliers, bien 
que la série diverge en tout point de ce 
cercle. On peut montrer que, si D est le 
disque de convergence d’une série entière 
de somme / il existe au moins un point 
singulier pour /, sur sa frontière, mais il se 
peut que tous les points frontières soient 
des points singuliers (séries « lacunai- 
res ») ; on dit alors que D est le domaine 


naturel d’existence de la fonction, car, dans 
ce cas, on ne peut pas la prolonger en une 
fonction analytique dans un ouvert 
connexe plus grand. 

Éléments analytiques 

Pour étudier les problèmes posés par le 
prolongement analytique, nous introdui- 
rons une nouvelle notion due, sous cette 
forme, à Weierstrass. 

On appelle élément de fonction analyti- 
que, ou, en abrégé, élément analytique de 
centre a le couple (a, S) d’un nombre com- 
plexe a et d’une série entière S (de centre a) 
de rayon de convergence strictement posi- 
tif; par abus de langage, on désignera 
encore par S, dans ce qui suit, la somme de la 
série S dans son disque de convergence. Par 
exemple, toute fonction analytique dans un 
ouvert U définit un élément analytique de 
centre a en tout point a G U. 

On dit que deux éléments analytiques 
(a. S) et ( b , T) sont le prolongement 
analytique direct l’un de l’autre si leurs 
disques de convergence ont une intersec- 
tion non vide et si S et T coïncident dans 
cette intersection. L’idée est de chercher à 
« prolonger » un élément analytique (a, S) 
en construisant des « chaînes » : 

(û, S), ( Q 1, S t )» . 

telles que deux éléments analytiques consé- 
cutifs quelconques soient prolongements 
directs l’un de l’autre. 

Prolongement le long d'un chemin 

Soit y : [0, 1]— ► C un chemin ; on dit qu’un 
élément analytique (/;, S), de centre 
b = y(l), est le prolongement analytique le 
long de y d’un élément (a. S) de centre 
U = y(O) s’il existe une chaîne (au sens 
précédent) ; 

( fl> S), (fl lf S,), 

(a„_i, (a„, S„) = (b, T) 
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d’éléments analytiques centrés sur Y([0, 1]) 
dont les disques de convergence recou- 
vrent cette trajectoire. 

Si y est un chemin d’origine a et ( a , S) 
un élément analytique, il n’est pas toujours 
possible de prolonger cet élément analy- 
tique le long de y (par exemple, si la 
trajectoire de y contient un point singulier 
de S), mais on peut montrer que, si cela 
est possible, il y a unicité du prolongement. 
Par contre, ce prolongement ne dépend 
pas en général seulement de l’origine et 
de l’extrémité de y. Considérons, par 
exemple, l’élément analytique ( 1, S), où S 
est la série de Taylor au point 1 de la 
détermination principale du logarithme, 
S( 1) = 0. Le prolongement analytique le 
long des deux demi-cercles \z = 1, 
Im j > 0 et Im z < 0, respectivement de 

1 vers — 1, donne (- 1, T) et (— 1, U) où 
T et ü sont des déterminations du loga- 
rithme dans D(— 1, 1) qui diffèrent de 

2 nr, car : 

T(- 1) = /TT 
et : 

U(- 1) = — /TT ; 

si on considère aussi, à partir de ce même 
Clément (1, S), les prolongements analyti- 
ques le long de tous les chemins d’origine 
| et d’extrémité — 1 qui ne passent pas par 
0, on obtient une infinité d’éléments ana- 
lytiques différents (— 1. T,,), /îE Z, où T,, 
est la détermination du logarithme dans 
D(— 1, 0) telle que : 

T„( — l) = (2 n + l>*ir. 

Les problèmes que nous rencontrons ici 
et qui constituent ce qu’on appelait impro- 
prement la théorie des « fonctions » mul- 
tiformes trouvent leur véritable cadre dans 
la théorie des surfaces de Riemann. 


Surface de Riemann 
d’un élément analytique 
Soit ( a , S), un élément analytique de centre 
a , considérons l’ensemble X des éléments 
analytiques (h, T) qui sont des prolonge- 
ments analytiques de (a. S) le long de 
chemins du plan complexe. On désignera 
par p : X — * C l’application de « projec- 
tion » qui à (h, T) G X fait correspondre b. 

Soit B 0 — (b ih T,) G X un élément 
analytique du disque de convergence D 0 
et désignons par V(B 0 ) l’ensemble des 
éléments analytiques centrés dans D {) 
qui sont des prolongements analytiques 
directs de B () (ce sont les éléments analy- 
tiques déterminés par la fonction T 0 
analytique dans D 0 ). La restriction p„ de 
la projection p à V(B 0 ) est une bijection de 
V(B 0 ) sur D 0 au moyen de laquelle on peut 
« transporter » sur V(B(j) la structure ana- 
lytique du disque D 0 . On définira ainsi, à 
partir de ceux de D ( ), les ouverts de V(B 0 ) ; 
une fonction à valeurs complexes définie 
dans V( B„) sera dite analytique si f o p~o 1 
est analytique dans D () (fig. 9) : par 


fig. 9 



Surface de Riemann du logarithme complexe au- 

dessus de C * = C - 1 0 1 
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exemple p est analytique ; de même, 
l’application qui à ( b , T) associe T(b) est 
analytique. 

Par recollement, on a ainsi muni X 
d’une structure de variété analytique com- 
plexe de dimension (complexe) 1 ; le 
couple (X, p) s’appelle la surface de 
Riemann de l’élément analytique (a, S). 
On dit aussi que c’est une surface de 
Riemann au-dessus de l’ouvert G = p(X) ; 
pour des exemples et une introduction à 
l’étude des surfaces de Riemann, nous 
renvoyons à l’article suivant, qui traite de 
la représentation conforme. Signalons 
cependant pour terminer le principe de 
monodromie, qui affirme que, si G est 
simplement connexe, alors p est une 
bijection, donc X est analytiquement iso- 
morphe à G. 


8. Théorèmes d’approximation 

Le théorème de Runge affirme que, si U est 
un ouvert du plan complexe et A un 
ensemble ayant un point dans chaque 
composante connexe du complémentaire 
de U, alors toute fonction f analytique 
dans U est limite uniforme sur tout 
compact dans U d’une suite de fractions 
rationnelles dont les pôles appartiennent à 
A. Dans le cas particulier où U est borné 
et « sans trous », ce qui veut dire que 
C — U est connexe, alors / est limite 
uniforme sur tout compact d’une suite de 
polynômes. 

Le théorème de S. N. Mergelyan est un 
résultat difficile, publié en 1954 ; il affirme 
que, si K est un compact du plan complexe, 
de complémentaire connexe, toute fonc- 
tion continue sur K, holomorphe dans 
l’intérieur de K, est limite uniforme sur K 
de polynômes. 


9. Théorèmes de décomposition 


Théorème de factorisation 
de Weierstrass 

La théorie de Weierstrass a pour objet de 
généraliser aux fonctions entières (c’est-à- 
dire analytiques dans tout le plan com- 
plexe) le théorème de d’Alembert-Gauss. 

Les zéros non nuis d’une fonction 
entière peuvent être rangés en une suite 
(z rt ), chaque zéro étant répété dans cette 
suite un nombre de fois égal à sa multi- 
plicité, telle que z„ soit une suite crois- 
sante, car tout disque ne contient qu’un 
nombre fini de tels zéros. 

D’une part, étant donné une telle suite 
(z„), il existe une fonction entière F asso- 
ciée à cette suite de zéros. L’idée la plus 
simple consiste à poser : 


F(z) = 



mais ce produit ne converge que si la série 
X 1/| z n est convergente. Dans le cas géné- 
ral, il faut « corriger » le facteur (1 z/z n ) 
par un facteur exponentiel. On est ainsi 
conduit à introduire les fonctions suivan- 
tes, dites facteurs primaires : 


E p (z) = (1 — z) exp \ z + — + + 


zp ' 

P ■ ' 


Il est alors possible de trouver une suite 
( p n ) d’entiers positifs tels que le produit 
infini : 


f < z > = IR(z-) 

n - I 

soit normalement convergent sur tout 
compact de C, ce qui fournit une fonction 
qui convient. 

Inversement, soit / une fonction entière, 
(z n ) la suite de ses zéros non nuis et k 
l’ordre de multiplicité de la racine 0. Alors, 
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la fonction fjz k F est une fonction entière 
qui ne s’annule pas, donc de la forme 
où g est entière. 

Finalement, on a : 

f(z) = z*e*<*>T TE.f-), 

décomposition de f en facteurs primaires. 

On peut étendre ce résultat à un ouvert 
U simplement connexe de C : Soit A un 
sous-ensemble discret (donc nécessaire- 
ment dénombrable) de U et associons à 
chaque point aÇA une « multiplicité » n a 
qui soit un entier positif; on peut alors 
montrer qu’il existe une fonction analyti- 
que dans U dont les zéros sont exactement 
les points de A, avec les multiplicités 
correspondantes. Il en résulte que, si h est 
une fonction méromorphe dans U, alors 
elle peut s’écrire, dans U tout entier et non 
pas seulement localement, comme quo- 
tient de deux fonctions analytiques. 

Théorème de Mittag-Leffler 

La théorie de Mittag-Leffler a pour objet 
de généraliser aux fonctions méromorphes 
dans C la décomposition en éléments 
simples des fractions rationnelles. 

Soit fune fonction méromoruhe dans C 
et (z n ) la suite de ses pôles distincts, y 
compris éventuellement 0, organisée par 
module croissant, et soit : 



la partie principale relative au pôle z n . Par 
un procédé correctif analogue à celui qui 
est employé dans le théorème de Weiers- 
trass, on montre qu’il existe des polynômes 
Q„ tels que la série : 

F(2) =Z p "Gi;)- Q " (z) 

n - 1 


soit normalement convergente sur tout 
compact de C S, où S est l’ensemble des 
pôles. 

Dans ces conditions, la fonction : 
/(z)-F(z) 

est une fonction entière. 

On peut étendre ce résultat à un ouvert 
quelconque de C. 

Les théorèmes de Weierstrass et de 
Mittag-Leffler s’appliquent notamment aux 
développements eulériens des fonctions 
transcendantes élémentaires (cf. EXPONEN- 
TIELLE et logarithme , chap. 5), au déve- 
loppement de la fonction gamma (cf. fonc- 
tion gamma) et à la construction des 
fonctions elliptiques (cf. la partie B ci-après 
Fonctions elliptiques et modulaire). 

JEAN-LUC VERLEY 
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B, Fonctions elliptiques 
et modulaire 

Inaugurée par N. H. Abel et C. Jacobi, la 
théorie des fonctions elliptiques a été un 
sujet de prédilection pour les analystes 
pendant tout le XIX e siècle. Appliquées par 
B. Riemann et K. Weierstrass à l’étude des 
courbes algébriques dans le plan projectif 
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complexe, ces fonctions sont à la base de 
la théorie plus générale des fonctions algé- 
briques, du domaine de l’algèbre et de la 
géométrie algébrique. Généralisées par 
H. Poincaré, qui a étudié les fonctions 
« fuchsiennes », elles sont aussi à l’origine 
de la théorie des fonctions automorplws . II 
s’agit là de deux branches irès actives des 
mathématiques contemporaines, qui utili- 
sent simultanément des techniques d’ana- 
lyse et d’algèbre très élaborées. 

Intégrales circulaires et elliptiques 
Le calcul intégral classique montre qu’une 
intégrale de la forme : 

dx 

\/W) 

où P(x) est un polynôme du 2 e degré sans 
racine double, se calcule à l’aide de fonc- 
tions dites élémentaires, c’est-a-dire circu- 
laires ou hyperboliques. Posons par exem- 
ple : 



si x et t sont réels, ils doivent être compris 
entre ± 1, et l’on a u — Arc sin x, dont la 
fonction inverse est x = sin u ; comme u 
reste compris entre ± tt/2, la période 2 ]f 
de cette fonction inverse n’apparaît pas si 
l’on prend .v et t réels, 

Mais prenons-les complexes : si 0) est 
l’ensemble des points du plan dont l’affixe 
est non réel ou réel strictement compris 
entre ± 1. la fonction : 


1 



a une détermination holomorphe sur w, 
vaiant i à i-origine, qui à son tour a une 
primitive u(x) holomorphe sur (0 et nulle à 
l’origine. Quand x varie dans 0) le long de 


la partie [ 1, + oc [ (resp.] oc, 1]) de la 
frontière, au-dessus ou au-dessous, u décrit 
la droite Re u = Tl/2 (resp. — tt/ 2) 
au-dessus ou au-dessous de l’axe réel. De 
la formule intégrale de Cauchy (cf. la partie 
A ci-dessus Fonctions analytiques d’une 
variable complexe, chap. 5) résulte alors 
une correspondance conforme biunivoque 
entre x décrivant ta et u décrivant la bande 
ô définie par : 

— tt/2 < Reu < tt/2. 

Le principe de symétrie de Schwarz 
(cf. la partie A ci-dessus - Fonctions ana- 
lytiques d’une variable complexe, chap. 4) 
permet de prolonger cette correspondance 
par symétrie par rapport aux frontières 
rectilignes de (a et 5 : après ce prolonge- 
ment, à deux valeurs de u symétriques par 
rapport à l’une des droites Re U = ± 7f/2 
correspondent deux valeurs de x symétri- 
ques par rapport à l’axe réel, donc à deux 
valeurs de u différant de 2 TT correspond la 
même valeur de x. Ainsi l’inversion de 
l’intégrale circulaire : 



effectuée dans le champ complexe, donne 
une fonction de période 2 tt, qui, d’autre 
part, est évidemment solution de l’équa- 
tion différentielle : 



Ce raisonnement, dont le principe est 
de Cari Jacobi (1804-1 85 1). s’applique 
aussi à l’intégrale elliptique : 

dx 

VPÇTj’ 

où P est le degré 3 ou 4, sans racine double. 

P r enons par exemple : 

/'w dt 

J, V(t — a)(f — |3)(f — y) 
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Cette intégrale a une détermination holo- 
morphe sur 0, positive sur la partie 
]a, + oo[ de la frontière. Cette détermina- 
tion, à son tour, a une primitive w(.v) 
holomorphe sur 0 et nulle à l’infini. Quand 
.V varie dans 0 le long de la frontière, 
passant successivement par -j- 00, a, p, y. 
— 00, u décrit le périmètre 0, a , 6, c, 0 d’un 
rectangle, où a et ic sont réels < 0 ; comme 
dans le cas précédent, la correspondance 
conforme biunivoque, entre x décrivant 0 
et u décrivant l’intérieur ô de ce rectangle, 
se prolonge par symétrie par rapport aux 
frontières rectilignes de 0 et ô. Après ce 
prolongement, X prend la même valeur en 
deux points u symétriques par rapport à 
l’un des sommets du rectangle, donc admet 
un groupe (additif) de périodes engendré 
par T = 2 a, r' = 2 ic\ dont le rapport est 
imaginaire pur. 

Ainsi l’inversion de l’intégrale ellipti- 
que : 

J * co dt 

, V(/~ow-U)(f=rf 

donne une fonction doublement périodi- 
que, qui d’autre part est évidemment 
solution de l’équation différentielle : 

(~) = (x — a)(x — ( 3 )(x™.y| 

Propriétés générales 
des fonctions analytiques uniformes 
admettant un groupe 
de périodes donné G 

Le cas intéressant est celui qu’on vient de 
rencontrer, où G est engendré par deux 
périodes r, t' dont le rapport n’est pas réel. 
Une fonction holomorphe ou méromor- 
phc (c’est-a-dire quotient de deux fonctions 
holomorphes) sur le plan complexe C, 
admettant le groupe de périodes G, peut 


être restreinte à un parallélogramme de 
périodes de sommets w, u + T, u + r\ 
U -b T -b t', sur lequel elle prend toutes ses 
valeurs, ou bien considérée comme une 
fonction holomorphe ou méromorphe sur 
la variété compacte connexe C/G. 

D’après le principe du maximum , cette 
fonction ne peut être holomorphe sans être 
constante ; on appellera donc G-elliptique 
une fonction f méromorphe sur C admet- 
tant le groupe de périodes G, ou bien 
méromorphe sur C/G. Si f prend la 
valeur x aux points W’j(.Y), . . . . M.,(x) de C/G 
(points distincts sauf pour une nombre fini 
de valeurs de .v), on montre que l’entier n 
ne dépend pas de x , c’est l’ordre de la 
fonction f d’après la formule intégrale de 
Cauchy prise le long du périmètre d’un 
parallélogramme de périodes, les images 
réciproques dans C des points w;(s), déter- 
minées chacune modulo G, ont une 
somme indépendante (modulo G) de x. 
Une application géométrique de cette pro- 
priété est donnée dans l’article COURBES 
algébriques, chapitre 7 . Il résulte d’autre 
part que l’ordre de / est au moins 2. 

Soit maintenant g une autre fonction 
G-elliptique, prenant les valeurs y f {x) aux 
points Wj{x) ; le développement de : 

Il b-J’yC*)] 

/= 1 

est un polynôme en g de degré n dont les 
coefficients sont des fonctions rationnel- 
les 1 . r i(.y), .... r,,(x) ; on a donc, entre les 
deux fonctions G-elliptiques quelconques./ 
et g. la relation algébrique : 

= g» + + + r n (f)= 0 

En particulier, f et sa dérivée f 9 sont 
liées par une relation algébrique : toute 
fonction G-elliptique est solution d’une 
équation différentielle algébrique. 
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Soit encore h une fonction G-elliptique, 
prenant les valeurs z } (x) aux points w f (x) ; 
le développement de : 

zjQc) JT b — yk(*)] 

est encore un polynôme en g, cette fois de 
degré < n , dont les coefficients sont des 
fonctions rationnelles ^(x), .... s,(x) ; on a 
donc, entre les trois fonctions G-elliptiques 
f g, h , la relation algébrique : 

hV g {f,g) = + + 1.(0. 


avec : 

(3) ?2 = 60^I. .3=140^1. 

rGG — {0} tGG — {0} 

Du développement (2), il résulte que : 
4p 3 — g 2 v — g 3 —P ' 2 

est holomorphe et nulle à l’origine, d’où la 
formule fondamentale : 

(4) p ' 2 = 4p 3 — g 2 P — g3, 

prouvant que x = p (u) est fonction 
inverse de l’intégrale elliptique : 


z 

y = i 


d’où l’on peut tirer h en fonction ration- 
nelle de f et g pourvu que P ’ JJ, g) 7^ 0. 
Ainsi les fonctions G-elliptiques sont exac- 
tement les fonctions rationnelles de deux 
d’entre elles, f et g, choisies de manière 
que, pour un x convenable, une valeur F y (x) 
soit distincte de toutes les autres. Les 
raisonnements de cet alinéa et du précé- 
dent peuvent être faits sur une variété 
compacte quelconque. 


les fonctions de Weierstross 
L’ordre d’une fonction G-elliptique étant 
au moins 2. on en cherche une d’ordre 2 : 
la somme de la série de terme général 
1 j(u — T) 2 , pour r EG, répondrait à la 
question si elle avait un sens ; une légère 
modification, dont le seul but est d’assurer 
la convergence nécessaire, donne la fonc- 
tion de Karl Weierstrass (18 15-1 897), 
notée par lui d’un p gothique : 


(1) p{u) = — + 




1 


(u-ry 


C’est une fonction paire et G-elliptique 
d’ordre 2, car l’origine en est un pôle 
double, et le seul pôle modulo G ; au 
voisinage de l’origine, on a : 

(2) p(«)= l/w 2 + (g 2 /20)u 2 + + 


U = 


j 


dx 

V4x 3 — g 2 *— fi 


considérée au chapitre 1, ou encore que 
X = p(u), y = p’(u) est une représentation 
paramétrique de la cubique : 

y 2 = 4x 3 — g 2 x— g 3 , 


qui, pour cette raison, est dite elliptique 

(Cf. COURBES ALGÉBRIQUES, diap. 7 ) . 

Aux deux points de C/G, où p prend 
une valeur donnée x, la fonction p 1 prend 
des valeurs opposées ; par suite (cf. 
chap. 2), les fonctions G-elliptiques sont 
exactement \ss fonctions rationnelles de p et 
p'. De la formule de Weierstrass : 


P( u ) + P(v) + P(U + v) 


1[ F(U)-p y (v) 2 

4 L p(w) p(v) . 


résultent, d’abord, une relation algébri- 
que entre p(u), p(v), p(w + v), puis une 
relation algébrique entre /(w), /(v), 
f (u v) pour une fonction G-elliptique 
quelconque f Le problème de Weierstrass 
est la recherche des fonctionsfanalytiques 
uniformes ayant cette propriété : ce sont 
les fonctions rationnelles de la variable ou 
de l’exponentielle, et les fonctions ellipti- 
ques. 

Les autres fonctions de Weierstrass 
attachées à G, C et a, respectivement 
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méromorphe et holomorphe partout, ne 
sont pas G-elliptiques, mais sont liées à p 
par les formules : 

(5) t = p» s'/a = C ; 

elles permettent d’exprimer toute fonction 
G-elliptique d‘ ordre fl soit en combinaison 
linéaire de il fonctions dérivées de trans- 
latées de C, soit comme quotient du produit 
de il translatées de (J par le produit de n 
autres translatées de a. 


Les fonctions de Jacobi 

Les développements en séries de p et Ç, 
en produit infini de a, convergent lente- 
ment : si l’on garde seulement les termes 
ou facteurs correspondant aux périodes j 
de modules ^ k, l’erreur commise est 
de l’ordre de 1 jk ; le calcul numérique 
exige une convergence plus rapide, au 
moins celle d’une série géométrique, 
qu’on obtient en formant d’autres fonc- 
tions. 

Choisissons un couple de périodes r, f 
engendrant le groupe G : le rapport t'/t 
n’étant pas réel, on peut supposer sa partie 
imaginaire > 0, et, de plus, aussi grande 
que l’on veut, pour que le développement 
(6) ci-dessous converge plus vite ; alors 
A = exp (tt/t'/t) est le module < 1, aussi 
petit que l’on veut. On note : 

( 6 ) H(u) = / l)*A<*-i /2 > 2 

X exp [(2k 1 )niu /r], 

somme portant sur tous les entiers k : c’est 
une fonction holomorphe partout, 
impaire, vérifiant : 

(7) H(m + t) = — H(w ), 

H (u + r') = — (l/K) exp (- liciti /t)H(w) ; 

elle ne dépend que des rapports fj T et uj T. 


Par suite, la fonction méromorphe 
paire : 

/ H( W + r/2) 

a exp ( mu A) H((< + t , /2) 

admet les demi-périodes t et t', et la 
fonction méromorphe impaire : 

m !-* exp ( mu /t) + t , /2) 

admet la demi-période r et la période T - ; 
on obtient les fonctions 2 G-elliptiques 
(2 G-homothétique de G dans le rapport 2) 
en u et sn U en les multipliant respec- 
tivement par des constantes telles 
que en 0 = sn r/2 = 1. La notation de 
ces nouvelles fonctions rappelle celle 
des fonctions circulaires COS et sin en 
raison de certaines analogies : ainsi 
cn 2 w + sn 2 u = 1 ; comme ces fonctions 
ne dépendent que des rapports t'/t et uj T 
on peut choisir r en fonction de t'/t de 
manière que les développements de 
Maclaurin commencent par : 


en u = 1 — 


2! 


-(* 2 


1) 3! + ' 


où k 2 ne dépend que de t'/t ; sn U est alors 
solution de l’équation différentielle : 


(Ê ) 2=(1 -* 2 ) 0 -kW), 


donc s’obtient aussi par inversion de {Inté- 
grale elliptique de Legendre : 

f; __ fx dt 

u - Jo V(l— f 2 )(l— * 2 * 2 ) ‘ 


La fonction modulaire 

Les formules (3) associent au groupe G les 
nombres g 2 et g 3 , appelés invariants de G ; 
on peut en effet les considérer comme 
fonctions d’un couple T, t' de périodes 
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engendrant G. et ces fonctions sont 
inchangées quand on remplace le couple T, 
T par un autre couple engendrant G, donc 
par un couple ciT + hr’, CT + d l', où a, 6, 
C\ d sont des entiers tels que ad bc = 1. 

En outre, le rapport gijgy est conservé 
par une homothétie sur G, donc est 
fonction du rapport C = t/t' des deux 
périodes engendrant G, fonction inchan- 
gée quand on effectue sur la variable Ç une 
substitution modulaire ; 

La fonction modulaire J est celle qui à 
C = t/t' fait correspondre : 


J (0 = 


JG 

gi — 27 g 3 2 ’ 


elle n’a de sens que pour £ non réel, c’est 
pourquoi on la considère sur le demi-plan 
supérieur Im C < 0, où elle est holomor- 
phe ; elle est invariante par les substitu- 
tions modulaires, en particulier par la 
translation Ç ► t, -|- 1. C’est donc aussi, 
pour vv | < 1, une fonction holomorphe 
de \v = exp (2 TT/Ç), à savoir : 


(8) J(C) = 

W Jx (1 H 1 *) 24 

k > 1 


k 3 w k 


ri v k * v 

x Iï2 +20 Zt3 


Le groupe modulaire , formé des substi- 
tutions modulaires, opérant sur le demi- 
plan supérieur, admet le domaine fonda- 
mental A défini par les inégalités : 


ICI < 1,— 1/2 < ReÇ < 1/2; 

cela veut dire que les images de A par les 
substitutions modulaires (la figure 
ci-contre en indique queiques-unes) sont 
deux à deux disjointes tandis que les 
images de A (réunion de A et sa frontière) 



couvrent le demi-plan. La jonction J réalise 
une bijection holomorphe de A sur 
l’ensemble des points du plan dont l’affixe 
est non réel ou réel > 1. 

En particulier, la dérivée J’ ne s’annule 
qu’aux points / etj de la frontière de A, où 
J prend les valeurs 1 et 0 respectivement, 
et aux points images des précédents par les 
substitutions modulaires ; par suite, la 
fonction analytique multiforme inverse de 
J, dont les valeurs appartiennent au demi- 
plan supérieur, se prolonge analytique- 
ment le long de tout chemin, tracé dans le 
plan, évitant les points 0 et 1. 

De là résulte que, pour les fonctions 
holomorphes omettant deux valeurs dis- 
tinctes, donc aussi pour les fonctions mero- 
morphes omettant trois valeurs distinctes, 
on retrouve certaines propriétés des fonc- 
tions holomorphes à valeurs dans un demi- 
plan ou, ce qui revient au même par com- 
position avec une homographie, des 
fonctions holomorphes bornées. Ainsi, du 
fait qu’une fonction non rationnelle, méro- 
morphe partout, ne peut être borner sur le 
complémentaire X d’un disque (théorème 
assez élémentaire, qui est dû hLiouville ), on 
déduit, grâce à la fonction modulaire, 
qu’une teiie fonction ne peut omettre trois 
valeurs sur X (ce dernier théorème, beau- 
coup plus profond, est dû à Picard ). 
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Les fonctions automorphes 
On doit à Henri Poincaré (1854-1912) une 
vaste extension des fonctions elliptiques. 
Les translations étant des automorphismes 
du plan, c’est-à-dire des bijections holomor- 
phes du plan sur lui-même, et les fonctions 
G-elliptiques des fonctions méromorphes 
sur le plan invariantes par le groupe G 
d’automorphismes, on peut de même se 
donner un groupe G d’automorphismes 
d’un disque ou demi-plan D et chercher des 
fonctions méromorphes sur D invariantes 
par G : on les appellera G-automorphes. 

Pour qu’il en existe d’autres que les 
constantes, il est évidemment nécessaire 
que G satisfasse à la condition suivante, 
que Poincaré énonçait « G-discontinu », et 
qu’on énonce maintenant « G-discret » : 
aucun élément g de G n’est limite d’élé- 
ments de G distincts deg. Poincaré montra 
que cette condition nécessaire est aussi 
suffisante pour qu’il existe des fonctions 
G-automorphes (il disait « fuchsiennes ») 
non constantes. 

Lorsque la variété D/G n’est pas com- 
pacte, ce qui est le cas général, deux 
fonctions G-automorphes ne sont pas en 
général liées par une relation algébrique : 
ainsi, pour le groupe modulaire, la fonc- 
tion modulaire J est une fonction auto- 
morphe holomorphe, donc aussi e\ qui 
n’est pas liée algébriquement à J. Une 
fonction automorphe pour ce groupe est 
liée algébriquement à J, si, et seulement si, 
comme J d’après la formule (8), cette 
fonction est une fonction méromorphe de 
H' = exp (2 Tn'Ç) pour w < L 

Poincaré caractérisa les domaines fon- 
damentaux A des groupes G-discrets, et 
divisa ces groupes en familles suivant la 
disposition de A, dont dépend l’existence 
d’une relation algébrique entre deux fonc- 
tions G-automorphes. La première famille 


est formée des groupes G pour lesquels la 
frontière de A ne rencontre pas celle de D ; 
ce sont aussi les groupes G pour lesquels 
la variété D/G est compacte, de sorte que 
deux fonctions G-automorphes quelcon- 
ques sont liées par une relation algébrique. 

Inversement, à toute relation algébrique 
entre deux variables x et on peut associer 
un groupe G-discret et un couple de fonc- 
tions G-automorphes non constantesfet g 
liées par cette relation ; autrement dit, toute 
courbe algébrique peut être paramétrée à 
l’aide d’un couple de fonctions automor- 
phes : je = /(£), y = g(Q. Ce résultat 
remarquable de Poincaré, publié en 188 1, 
généralise le fait que toute cubique non 
unicursale, donc aussi toute courbe algébri- 
que de genre 1 (cf. COURBES ALGÉBRIQUES, 

chap. 6 à 8), peut être paramétrée à l’aide 
d’un couple de fonctions elliptiques. 

Les fonctions périodiques 
de plusieurs variables complexes 
La construction de la fonction p de Weiers- 
trass montre, parmi bien d’autres choses, 
qu’étant donné deux nombres complexes 
T| , T*) linéairement indépendants sur le 
corps R des nombres réels il existe tou- 
jours une fonction méromorphe sur le plan 
C, dont le groupe de périodes est exacte- 
ment celui qu’engendre le couple Tj, T?. 

11 n’en est plus ainsi lorsqu’on passe à 
m variables complexes, m J? 2. Étant 
donné 2 m vecteurs Tj, .... dans C'” 
(écrits dans la suite comme colonnes d’une 
matrice T à m lignes), linéairement indé- 
pendants sur R, pour qu’il existe une 
fonction méromorphe sur C m , dont le 
groupe de périodes soit exactement celui 
qu’engendrent Tj, . ... il faut et il suffit 
que ces 2 M vecteurs soient liés par les 
conditions de Frobenius suivantes : Il existe 
une matrice carrée A d’ordre 2 m, inver- 
sible et symétrique gauche, à éléments 
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entiers, telle que la matrice symétrique 
gauche (d’ordre m) TA(T) soit nulle, ce 
qui fait m(m l)/2 équations linéaires, et 
la matrice hermitienne (d’ordre Ifl) 
i TA(T) définie positive. 

D’autre part, le mathématicien Cari 
Ludwig Siegel a étendu à plusieurs varia- 
bles le groupe modulaire, sous le nom de 
groupe modulaire symplectique. Au lieu 
d’une variable Ç telle que (l//)(t — Z) > 0, 
il considère une matrice carrée symétri- 
que Z d’ordre m , telle que la matrice her- 
mitienne (1//)(Z Z) soit définie positive : Z 
décrit alors, dans O* avec p = m(m + 1)/ 
2, un domaine de Siegel, qui est lié aux 
conditions de Frobenius, comme le demi- 
plan supérieur à la condition Ç = Tj/l 2 non 
réel. De même que les automorphismes du 
demi-plan supérieur sont les homographies 
C *-»* (aÇ + b){ct, + d) 1 avec a. b , c, d réels, 
ad — bc = 1 , ou : 

de même les automorphismes du domaine 
de Siegel sont les applications : 

Z-(AZ + B)(CZ + D)— 1 , 

avec A, B, C, D matrices carrées d’ordre 
m à éléments réels : 



(1 est la matrice unité pour la multiplica- 
tion) ; on obtient le groupe modulaire 
symplectique en prenant A, B, C, D à 
éléments entiers. 

MICHEL HERVÉ 
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C. Représentation conforme 

La représentation conforme la plus ancien- 
nement connue est la projection Stéréogra- 
phique, inventée par les Grecs (Hipparque, 
Ptolémée). Les problèmes cartographiques 
conduisirent à la découverte d’autres appli- 
cations conservant les angles d’un domaine 
sphérique sur un domaine plan, telle la 
projection de Mercator (XVI e siècle). Au 
début du XIX e siècle, Cari Friedrich Gauss 
étudia systématiquement les propriétés 
intrinsèques des surfaces de l’espace habi- 
tuel ; en particulier, il examina les applica- 
tions bijectives d’une surface sur une autre 
qui sont différentiables, ainsi que leur réci- 
proque, et qui conservent les angles. La 
notion de représentation conforme reçut 
un nouvel éclairage avec l’avènement de la 
théorie des fonctions d’une variable com- 
plexe, à laquelle elle est intimement liée. 
Bernhard Riemann sut exploiter cette rela- 
tion de façon particulièrement féconde, 
introduisant la notion de surface de Rie- 
mann, qui résout les difficultés dues aux 
« fonctions multiformes » et donne un 
cadre convenable à la théorie du prolonge- 
ment analytique. Cette théorie pose un cer- 
tain nombre de problèmes topologiques qui 
ont conduit Bernhard Riemann et Henri 
Poincaré à développer les premières bases 
de la topologie algébrique. 
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1 . Définition 

La représentation conforme 

Considérons un domaine D du plan R 2 . On 
dit qu’une application différentiablefde D 
dans R 2 est conforme en un point z 0 de D si 
sa dérivée (ou application linéaire tan- 
gente) D i /(z 0 ) en Zq conserve les angles 
orientés (Cf . calcul infinitésimal - Calcul 
à plusieurs variables). En convenant que 
l’angle en Zq de deux chemins différentia- 
bles y, et y 2 passant par z 0 est l’angle de leurs 
tangentes en z 0 , on voit que cette condition 
revient à la suivante : l’angle orienté en /(z 0 ) 
des chemins images f o y, et/o Y2 est égal 
à l’angle orienté de y, et y 2 en % Qu^ 8 ci 116 
soient les chemins y, et y 7 différentiables 
passant par z 0 (fig. 1). 

On sait qu’une application linéaire du 
plan dans lui-même, qui conserve les angles 
orientés est une similitude directe de cen- 
tre 0. Ainsi, la conformité de/en z 0 signifie 
que l’application linéaire tangente D 1 /(Zq) 
est une similitude directe. Il est très com- 
mode de représenter les similitudes à l’aide 
de la multiplication des nombres comple- 
xes. Dans la suite, on considérera que le 
plan est le corps des nombres complexes C, 
et l’on écrira x + iy pour le point (x, y) du 
plan (cf. nombres complexes) ; une simili- 
tude directe de centre 0 est alors une appli- 
cation de la forme z *— *■ az , où a est un 
nombre complexe non nul dont le module 
et l’argument sont respectivement le rap- 
port et l’angle de la similitude ; dans la base 
canonique (1, i) de C sur R, la matrice de la 
similitude considérée s’écrit : 



où a est la partie réelle de a, et (3 sa partie 
imaginaire. 

Dire que f est conforme en z 0 revient 
donc à dire que sa dérivée est de la forme 


fig. 1 




Conservation des angles 

h i— ► ah, avec a EC, <2^0 ; par consé- 
quent, le rapport : 

f(z 0 + h)—f(z 0 ) — ah _f(z 0 +h)—f(z 0 ) j 

h h 

tend vers 0 avec //, ou encoref’est dérivable 
au sens complexe en z 0 , avec comme 
dérivée, /'(zq) = (1 # 0 (cf. la partie A 
ci-dessus — Fonctions analytiques d’une 
variable complexe, chap. 2). En termes 
réels, on doit écrire que la matrice jaco- 
bienne de /— P + /Q, soit : 

/ zz 

dx ôx I 
d P dQ 
\<^ ày] 
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est de la forme : 

a —P 
p a 

ce qui donne les conditions de Cauchy- 
Riemann : 

dx ôy dy ôx 

Ainsi toute fonction holomorphefdans 
D, dont la dérivée ne s’annule pas, est 
conforme en tout point de D. Or on peut 
montrer que l’image d’une partie ouverte 
de C par une fonction holomorphe non 
constante est ouverte ; l’image du domaine 
D par une fonction holomorphe non 
constantefest donc un domaine /(D). De 
plus, si / est injective (on dit quelquefois 
univalente), sa dérivée ne s’annule pas ; f 
définit une bijection de D sur /(D) dont 
l’application réciproque est holomorphe 
dans /(D) ; f est alors une représentation 
conforme de D sur f’(D). Les domaines D 
et f (D) sont dits conformément équiva- 
lents, ou encore isomorphes ; en ce qui 
concerne la théorie des fonctions analyti- 
ques, ils ont les mêmes propriétés, car 
l’application : g gof est une bijection de 
l’ensemble des fonctions holomorphes 
dans f (D) sur l’ensemble des fonctions 
holomorphes dans D. Enfin, si g est une 
représentation conforme de /(D) sur un 
nouveau domaine D’, la composée go/ est 
une représentation conforme de D sur D’. 

Exemples de représentations conformes 

Chaque fonction holomorphe injective 
dans un domaine D définit une représen- 
tation conforme de D sur f (D). Par 
exemple, la fonction z l— ’ * Z 2 est holomor- 
phe et injective dans le demi-plan supérieur , 
défini par Im • > 0 : son image est le 
complémentaire dans C de R* (ensemble 
des nombres réels strictement positifs), 


c’est-à-dire le plan fendu suivant le demi- 
axe réel positif. Comme : 

(x + iy) 2 = x 2 — y 2 + 2 ixy, 


on voit que l’image de la demi-droite .y = a 
(< a ^ 0), y > 0 est la demi-parabole : 

(1) X = û2 — aY>0. 

4a i 

La parabole (1) admet l’axe réel pour axe 
de symétrie ; son foyer est en 0 et son som- 
met d’ordonnée positive. L’image de la 
demi-droite x = 0 , y > 0 est le demi-axe 
réel négatif. De plus, la droite? = b(b > 0) 
est transformée en la parabole : 


Y 2 

x = w~ l 


qui a pour axe l’axe réel ; son foyer est en 0 
et son sommet d’ordonnée négative. Les 
paraboles de la famille (1) sont évidemment 
toutes orthogonales à celles de la famille (2) 
(fig. 2). Remarquons que l’application 
conforme considérée se prolonge continû- 
ment à la frontière y = 0 du domaine (en 
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fait z Z 2 est holomorphe dans le plan tout 
entier, mais non injective) ; l’image de cette 
frontière est la frontière du domaine image 
(le demi-axe réel positif). 

Par restriction de la représentation 
conforme précédente, on obtient une 
représentation conforme du demi-plan 
y > b sur l’extérieur d’une parabole. 

On peut étudier de la même façon la 
fonction holomorphez ► z n (fl entier > 0), 
qui est injective dans le secteur angulaire 

O < argz < 2 TT /«, 

et définit une représentation conforme de 
ce secteur angulaire, sur le plan fendu 
suivant l’axe réel positif. Ici encore, la 
représentation se prolonge par continuité 
à la frontière, mais, au point 0, la trans- 
formation cesse d’être conforme, car la 
dérivée s’annule ; chaque angle en 0 est 
multiplié par n dans cette transformation. 

Les applications réciproques de ces 
représentations conformes fournissent de 
nouveaux exemples : dans le plan fendu 
suivant le demi-axe réel positif, on définit 
sans ambiguïté la fonction z | — * - z^ n par la 
condition : 

O < argz 1/n < 2 t r/n, 

et on obtient une représentation conforme 
du plan fendu sur un secteur angulaire 
d’amplitude 2 ir/n. Pour tout exposant a 
réel > 0, on peut définir une représentation 
conforme z z" dans le secteur angulaire : 

0 < argz < inf (2 7t, lit/a).. 
en imposant la condition : 

o < argz a < 2 ttcx, 

qui détermine une branche holomorphe de 
la fonction considérée, injective dans le sec- 
teur décrit par: ; l’image de cette représen- 
tation conforme est le secteur angulaire : 

0 < argz < inf(27ra, 2 tt). 


En composant de telles représentations 
conformes, on peut construire une repré- 
sentation conforme d’un secteur angulaire 
quelconque sur un autre, par exemple sur 
le demi-plan supérieur. Pour préciser la 
représentation z ► Z l/2 du plan fendu sur 
le demi-plan supérieur, décrivons les trans- 
formées des droites parallèles aux axes. 
L’image de la droite x = a (a 7^ 0 ) est la 
demi-hyperbole équilatère : 

( 3 ) X 2 — Y 2 = a, Y > 0, 

dont les asymptotes sont les bissectrices 
des axes de coordonnées ; si a > 0, les 
sommets sont sur l’axe réel et l’image est 
formée de la moitié supérieure de chacune 
des branches de l’hyperbole ; si, au 
contraire, a < 0, les sommets sont sur 
l’axe imaginaire et l’image est la branche 
supérieure de l’hyperbole. La droite x = 0 
a pour image la réunion des deux demi- 
bissectrices des axes qui sont dans le 
demi-plan supérieur. Enfin, la droite y — b 
(b 7^ 0) est transformée en la branche 
supérieure de l’hyperbole équilatère : 

( 4 ) 2XY = b, 

dont les asymptotes sont les axes de coor- 
données et la demi-droite y zn 0, .y < 0 est 
transformée en la demi- droite X zn 0 , 
Y > 0 . Chaque hyperbole de la famille ( 4 ) 
est orthogonale à toutes les hyperboles de 
la famille ( 3 ) (fig. 3 ). Le demi-plan y > b 
est représenté conformément sur l’inté- 

rieur d’une branche d’hyperbole. 

Étudions maintenant la représentation 
conforme définie par la fonction z * 1 /z, 
qui est holomorphe et injective dans 
C — ( 0 ) et admet pour image C { 0 } ; 
cette transformation est sa propre réci- 

proque (transformation involutive). 

Ici : 

1 x - iy 

x + iy x 2 +y 2 
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Y — — b 

fig. 3 

y ~~ b 
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et les droites x = Cl (a ^ 0) et 
V = b (b 0) sont respectivement trans- 
formées en les cercles passant par 0 
(privés de 0) : 

(5) a(X 2 +Y 2 ) = x, 

(6) b(X 2 + Y”) = -Y ; 

les cercles (5) sont orthogonaux aux cer- 
cles (6) ; ils sont centrés sur l’axe réel et 
tangents en 0 à l’axe imaginaire (fig. 4). 
Les droites x = 0 et y = 0 sont globale- 
ment invariantes. Plus généralement, cha- 
que droite issue de 0 est transformée en sa 
symétrique par rapport à l’axe réel ; en 
composant avec la symétrie (Taxe R, on 
obtient une transformation z 1/5, appe- 
lée inversion (de pôle 0 et de puissance 1), 
qui laisse globalement invariante chaque 
droite issue de O ; elle transforme les 
angles en leurs opposés. De cette transfor- 
mation se déduit par restriction une repré- 
sentation conforme du demi-plan y > b 
sur le disque b(X~ + Y’) + Y < 0 ; en 
composant à droite avec la translation 
z r + ib et à gauche avec la similitude 


ji— ► 1 2 biz , on trouve une représenta- 

tion conforme : 

| z^ib 
z + ib 

du demi-plan supérieur y > 0 sur le disque 
unité z < 1 (on peut prendre b = 1) ; 
cette transformation se prolonge à la 
frontière, l’image de la droite y = 0 étant 
le cercle unité privé du point — 1. Il est 
maintenant possible de construire une 
représentation conforme d’un secteur 
angulaire quelconque sur le disque unité, 
puisqu’un tel secteur se représente confor- 
mément sur le demi-plan. 

La fonction z e~ donne un nouvel 
exemple de représentation conforme (cf. 

EXPONENTIELLE ET LOGARITHME ) . Elle est 

holomorphe dans tout le plan et sa res- 
triction à la bande 0 < 1m 2 < 2 Tf est 
injective ; l’image de cette bande est le plan 
fendu suivant le demi-axe réel positif. 
Comme e z = e x+l} — e x e lx \ c’est-a-dire 
| e z == e x ar g — y, nous décrirons 
l’image à l’aide des coordonnées polaires 
r et 0 (0 < 0 < 2 TT). Les segments X 
— constante de la bande sont transformés 
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en cercles de centre 0 (privés du point réel 
> 0) ; les droites y = constante sont 
transformées en demi-droites passant par 
0 (fig. 5). La transformation réciproque, 



fig. 5 

y 

2 n 




y — b 


x = a 

0| x 

( 

x -- a 

l 0 

y 

Représentation z •-» e 

| y = b 


notée lg, représente le plan fendu confor- 
mément sur une bande. 

La fonction : 

z * cos z — + e-*) 

est composée des fonctions : 


z^iz = ty 



Étudions d’abord la dernière fonction : 
elle est holomorphe dans le plan privé de 


0, et prend la même valeur aux points u et 
1 ju : restreinte à l’extérieur u > 1 du 
disque unité, elle est injective et représente 
conformément l’extérieur du disque unité 
sur le plan privé de l’image du cercle unité, 
c’est-à-dire le plan privé du segment 
d’extrémité 1 et 1. Si u = re lQ (r > 1), 
les coordonnées de son image sont : 



les cercles de centre 0 sont donc trans- 
formés en ellipses de foyers — 1 et 1 , tandis 
que les droites passant par 0 sont trans- 
formées en hyperboles ayant les mêmes 
foyers, avec dégénérescence en les axes de 
coordonnées (fig. 6). La même fonction 



donne une représentation conforme du 
disque unité privé de son centre sur le plan 
privé du segment d’extrémités 1 et 1. 

Il est maintenant facile de voir que 
la fonction COS définit une représen- 
tation conforme de la demi-bande 
0 < Re z < 2 TT, Im z > 0 sur le plan 
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privé de la demi-droite Im Z - 0, 
Re z > - 1 (fig. 7). 



Représentation z »-» cos z 


2. Le problème 

de la représentation conforme 

Étant donné des domaines D et D’ du plan, 
sont-ils conformément équivalents ? Dans 
l’affirmative, il s’agira de construire, au 
moins d’une manière approchée, une repré- 
sentation conforme de D sur D’. Ce pro- 
blème a des applications en diverses ques- 
tions de physique (par exemple en 
hydrodynamique), car il permet de résou- 


dre certains problèmes de Dirichlet : pour 
trouver une fonction harmonique w, 
connaissant une courbe u = a (constante, 
qui est la frontière d’un domaine D confor- 
mément équivalent au demi-plan supérieur, 
on utilise une représentation conformefde 
D sur le demi-plan supérieur ; si / se pro- 
longe par continuité à la frontière de D et 
transforme cette frontière en celle du demi- 
plan, soit la droite Im z = 0, la solution est 
U — Im (f + a) (Cf. POTENTIEL ET FONC- 
TIONS HARMONIQUES). 

Si les domaines D et D’ sont conformé- 
ment équivalents, ils sont homéomorphes , 
c’est-à-dire qu’il existe une bijection conti- 
nue de D sur D’ dont la réciproque est aussi 
continue. Ainsi est réalisée une condition 
nécessaire d’isomorphisme ; mais cette 
condition n’est pas suffisante, car le plan C 
et le disque unité sont homéomorphes 
(l’application Z'-* zj( 1 + z|) est un 

homéomorphisme du premier sur le 
second), mais certainement pas isomor- 
phes, puisque la fonction z * z est holo- 
morphe et bornée dans le disque unité, alors 
que toute fonction holomorphe et bornée 
dans C est constante d’après le théorème de 
Liouville (cf. la partie A ci-dessus - Fonc- 
tions analytiques d’une variable complexe). 

D’ailleurs, comme on l’a vu ci-dessus, 
une grande variété de domaines sont 
conformément équivalents au disque 
unité : le demi-plan, un secteur angulaire, 
une bande ou une demi-bande, l’extérieur 
d’une parabole. En fait, Riemann a obtenu 
(par une démonstration un peu incom- 
plète) le remarquable résultat suivant : 
Tout domaine D différent du plan C et 
simplement connexe (c’est-à-dire que tout 
lacet de D peut se déformer continûment 
dans D en un point) est conformément 
équivaient au disque unité. 

Ce théorème a été complètement 
démontré par W. F. Osgood. puis par 
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P. Koebe, qui l’a généralisé en donnant 
aussi des modèles pour les domaines non 
simplement connexes à l’aide du disque 
unité privé d’un certain nombre d’arcs de 
cercles de centre 0. Voici les étapes de la 
démonstration : 

a) On commence par se ramener au cas 
où D est borné en construisant une fonc- 
tion holomorphe bornée et injective dans 
D (c’est assez facile). 11 est alors possible 
de trouver des représentations conformes 
de D sur des domaines contenus dans le 
disque unité (à l’aide de similitudes, par 
exemple). 

b) En choisissant un point a de D et en 
considérant l’ensemble F des représenta- 
tions conformes de D sur des parties du dis- 
que unité qui transforment Cl en 0, on 
démontre que, pour un élément / de F, les 
propriétés suivantes sont équivalentes : (1) 
F’ image de D parfest le disque unité. (II) 
\f\à) /est maximale parmi les valeurs que ce 
nombre peut prendre lorsquefparcourt F. 

c) Il reste à démontrer l’existence d’un 
élément f de F qui réalise le maximum de 

| / ‘(a) |. Cela résulte du fait que F est un 
ensemble compact pour la « topologie de la 
convergence compacte » dans D et que 
\f'( a ) est une fonction numérique 
continue dans F. 

En général, on ne peut pas déterminer 
explicitement une représentation conforme 
de D sur le disque unité, mais seulement 
chercher à construire des approximations 
d’une telle représentation ; c’est un pro- 
blème d’analyse numérique qui peut être 
difficile. Fa méthode de H. A. Schwarz 
donne explicitement une représentation 
conforme du demi-plan supérieur sur un 
polygone convexe arbitraire par une for- 
mule du type : 

^ (** dt 

z Jo Jt — o,) a ' (f — a„)“. 


OÙ les nombres Oj sont réels et les exposants 
ex,- compris entre 0 et 1 et de somme 2 ; 
pour n = 4 et a, a 2 = ot 3 = a 4 = 1/2, 
l’intégrale considérée est une intégrale 
elliptique et donne une représentation 
conforme du demi-plan sur un rectangle 
(cf. la partie B ci-dessus - Fonctions 
elliptiques et modulaire). 

Il est possible de déterminer toutes les 
représentations conformes du plan sur 
lui-même ou du disque unité sur lui-même. 
Dans le cas du plan, une représentation 
conforme f : C — ► C est une fonction 
entière qui est injective ; cela entraîne 
d’abord que f est un polynôme, sinon la 
fonction U l— * / ( 1 ju) aurait une singularité 
essentielle à l’origine et transformerait le 
disque unité (privé de 0) en un ensemble 
partout dense dans C d’après un théorème 
de Weierstrass ; ainsi, l’image par / de 
l’extérieur du disque unité serait partout 
dense et, par suite, rencontrerait l’image 
du disque unité, qui est un ouvert : c’est 
impossible si/est injective. De plus, /doit 
être de degré 1, car un polynôme de degré 
n a n racines ; donc f est de la forme 
f {z) = HZ + b (a # 0) et la représenta- 
tion conforme est une similitude. Il est 
remarquable que les transformations du 
plan en lui-même qui conservent les angles 
conservent la distance euclidienne à un 
facteur près ; ces transformations forment 
un groupe à quatre paramètres, opérant 
transitivement. 

Passons au cas du disque unité, en étu- 
diant d’abord les automorphismes laissant 
fixe le point 0. Un tel automorphisme est en 
particulier une fonction holomorphe /telle 
que/(0) = Oet|/(z)|< 1 pour tout points 
du disque unité ; le lemme de Schwarz lui est 
applicable : f (z) <C z |, avec égalité seule- 
ment si f (z) est proportionnel à z (cf. la par- 
tie A ci-dessus - Fonctions analytiques 
d’une variable complexe) ; le même lemme 
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appliqué à f 1 donne z ^ |/(z) |, donc 
l’égalité a lieu et f {z) = az avec une cons- 
tante a de module 1. Si f est un automor- 
phisme quelconque du disque unité, on 
pose h =/ -1 (0). L’application : 


g:z 


z + b 
1 + bz 


est une représentation conforme du disque 
sur lui-même qui transforme 0 en b. Donc 
f og» qui est conforme et laisse 0 fixe, est 
une rotation Z 1 — * CIZ (| fl = 1), et : 


f (z) 


z + b 
1 + bz 


Les automorphismes du disque unité 
sont ainsi les transformations homographi- 
ques qui le laissent invariant ; ils forment 
un groupe à trois paramètres transitif dans 
le disque unité. On peut montrer qu’il 
existe une métrique riemannienne dans le 
disque unité qui est invariante par ce 
groupe ; sa courbure est constante et 
négative de sorte que la géométrie corres- 
pondante est celle de N. I, Lobatchevsky 
(c’est le fameux modèle de Poincaré pour 
la géométrie non euclidienne). 

Les résultats obtenus pour le disque 
unité se transposent au demi-plan. Comme 
le passage de l’un à l’autre s’opère au 
moyen d’une transformation homographi- 
que, les automorphismes du demi-plan 
supérieur sont les transformations homo- 
graphiques qui le laissent invariant : 


az + b 
CZ + à 


avec fl, b , c, d réels et ad—bc > 0. 


3. Surfaces de Riemann 


nées sont notées x, y, t ). La projection 
stéréographique de pôle (0, 0, 1) sur le plan 
t == 0 est l’application qui, à chaque point 
(x, y , t ) de la sphère distinct de (0, 0, 1), 
associe le point où la droite joi- 
gnant (0, 0, 1) à (x, y, î ) rencontre le plan 
t = 0 (fig. 8). 



Ainsi, l’image de (x, y , t ) est le point : 



soit : 

* + iy 

l - t 

avec la notation complexe. Il est facile de 
montrer que cette application conserve les 
angles (c’est-à-dire que l’application 
linéaire tangente possède cette propriété). 
C’est une représentation conforme de la 
sphère privée du pôle (0.0, 1) sur le plan C. 

On peut aussi considérer la projection 
stéréographique de pôle (0, 0, — 1), qui 
s’écrit : 


Projection stéréographique 
et sphère de Riemann 

Considérons la sphère S 2 de centre 0 et de 
rayon 1 dans l’espace R 3 (où les coordon- 




x + iy 
1 -M ’ 


et représente conformément la sphère 
privée de (0, 0, 1) sur C. Il n’a pas été 
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tenu compte des questions d’orientation et 
un même angle orienté sur la sphère est 
transformé en des angles opposés par les 
deux projections ; ce défaut se corrige en 
composant la deuxième projection avec la 
symétrie d’axe réel, ce qui donne la repré- 
sentation conforme : 


de la sphère privée de (0, 0, — 1) sur C. Si 
Z et z sont les images d’un même point (.y, 
V, t ) distinct de (0, 0, 1) et de (0, 0, — 1) 
par nos deux représentations, alors : 

(-V +<»(JC — /y) J r 2 +.V 2 
( 1 - 0 ( 1 +0 1 — / 2 


ainsi on passe de l’une à l’autre par la 
transformation z l “~* 1 jz. 

Si D est une partie ouverte de la sphère, 
la première projection stéréographique 
identifie D privé éventuellement du pôle 
(0, 0, 1) à un ouvert D’ de C, tandis que 
la seconde projection identifie D privé 
éventuellement de (0. 0, 1) à un autre 

ouvert D” du plan. On dira qu’une fonc- 
tion numérique complexe / définie dans D 
est holomorphe si les fonctions correspon- 
dantes dans D’ et D” sont holomorphes ; 
cette définition est cohérente parce que la 
transformation z 1 — * 1 jz est un isomor- 
phisme de D’ privé éventuellement de 
l’origine sur D” privé éventuellement de 
l’origine. Avec cette notion de fonction 
holomorphe, la sphère S? s’appelle sphère 
de Riemann . Le plan s’identifie par la 
projection stéréographique de pôle (0, 0, 1) 
au complémentaire de (0, 0, 1) dans la 
sphère de Riemann ; comme ce point a 
pour image 0 par l’autre projection, il 
s’appellera point à l'infini noté x (prolon- 
geant ainsi z ► 1 \z en posant 1 /O = CO). La 


sphère de Riemann, ainsi considérée 
comme C complété par un point à l’infini, 
peut aussi s’identifier à la droite projective 
complexe P,(C). 

Pour déterminer les automorphismes 
de la sphère de Riemann, remarquons 
d’abord que ceux qui laissent fixe le point 
à l’infini donnent par restriction des auto- 
morphismes de C, c’est-a-dire des simili- 
tudes : 

z'—>az + b. 

Si /est un automorphisme quelconque, 
posons c = f~ ] ( oo) ; l’application : 

giz^c + 1 /z 

transforme oo en c et c’est un automor- 
phisme de la sphère de Riemann, donc 
J o g laisse oo fixe et c’est encore un 
automorphisme ; il en résulte que/o g est 
une similitude z l— * ÜZ + b et que : 



Les représentations conformes de la 
sphère de Riemann sur elle-même sont 
donc les transformations homographi- 
ques : 

az + b 

z l “ fc ; 

cz + d 

(a. b , C\ d complexes tels que ad — bc # 0). 
Elles forment un groupe à six paramètres 
réels et transforment les cercles en cercles 
(groupe circulaire). 

Courbes analytiques 
et surfaces de Riemann 
La structure qui a été définie précédem- 
ment sur la sphère s’exprime bien dans le 
langage des variétés, 

D’une manière générale, on appelle 
variété analytique complexe de dimension 1 , 
ou courbe analytique complexe (régulière), 
ou encore, par abus de langage, surface de 
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Riemann, un espace topologique séparé X 
muni d’un atlas analytique complexe maxi- 
mal à valeurs dans des ouverts de C. Cette 
définition repose sur la notion de carte de X 
à valeur dans un ouvert de C : il s’agit d’un 
homéomorphisme d’un ouvert de X sur un 
ouvert de C ; deux cartes dont les ouverts de 
définition se rencontrent définissent un 
homéomorphisme appelé changement de 
carte entre les deux images de l’intersection 
des ouverts de définition. Un atlas analyti- 
que complexe est une famille de cartes dont 
les ouverts de définition recouvrent X et tel 
que tous les changements de cartes (entre 
des cartes de la famille) soient holomor- 
phes ; par exemple, la projection stéréogra- 
phique de pôle (0, 0, l) et celle de pôle (0, 0, 
™ 1) composée avec la symétrie d’axe R 
sont des cartes de S-> et le changement de 
cartes est z >—► 1/z ; ces cartes forment un 
atlas analytique complexe de S 2 qui définit 
une structure de courbe analytique com- 
plexe sur la sphère (droite projective com- 
plexe). Voici encore un exemple important 
dans la théorie des fonctions elliptiques : 
étant donné deux nombres 0) et co' dont le 
rapport n’est pas réel, considérons le quo- 
tient X de C par le sous-groupe engendré 
par 0) et Cl)' ; muni de la topologie quotient de 
celle de C, c’est un espace séparé (homéo- 
morphe au tore T 2 ) sur lequel on définit un 
atlas analytique complexe à l’aide des 
ouverts de C assez petits pour que l'applica- 
tion canonique TT de C sur X y soit injective, 
en prenant pour cartes les réciproques des 
restrictions de TT à de tels ouverts ; X devient 
ainsi une courbe analytique complexe 
(courbe elliptique). 

Comme une fonction holomorphe est a 
fortiori différentiable (au sens réel), tout 
atlas analytique complexe est aussi un atlas 
différentiable et définit une structure de 
variété différentiable de dimension réelle 2. 
Une courbe analytique complexe possède 


donc une structure de surface différentia- 
ble ; cette surface est orientable et trian- 
gulable (la dernière propriété est due à 
T. Radé, 1925). 

On démontre qu’une surface orientable 
triangulable connexe et compacte est 
homéomorphe soit à la sphère S?, soit à 
une « sphère à p anses » (ou « tore à p 
trous ») obtenue en identifiant deux à deux 
les côtés d’un polygone à 4 p côtés selon 
le symbole : 

a \ b x a T'K' a i b 2 a ï'K' - a P b P \' b T' 

(où les 4 p côtés sont nommés dans l’ordre 
où ils se présentent sur le bord orienté du 
polygone, ci\ 1 devant être identifié à d\ 
après avoir renversé son orientation, etc., 
fig. 9). Chaque côté du polygone devient 
un lacet sur la surface et les classes 
d’homotopie des 2 p lacets ainsi obtenus 
engendrent le groupe fondamental de cette 
surface ; l’entier p s’appelle le genre topo- 
logique de la surface. La sphère S 2 est 
simplement connexe ; on lui attribue le 
genre 0. Le tore T 2 est de genre 1. Ces 
résultats s’appliquent aux courbes analyti- 
ques complexes connexes et compactes. 

Tout ouvert d’une courbe analytique 
complexe est muni d’une manière naturelle 
d’une structure induite qui en fait aussi une 
variété analytique complexe de dimen- 
sion 1. Plus généralement, si X est une 
courbe analytique complexe et si f\ X’ 1 ► X 
est un homéomorphisme local, l’espace X’ 
a une structure naturelle de courbe analy- 
tique complexe provenant de celle de X. 
Cela s’applique au revêtement universel X 
de X ; par exemple, le revêtement universel 
d’une courbe elliptique est C. 

La notion de fonction holomorphe sur 
une courbe analytique complexe se définit 
en procédant comme ci-dessus pour la 
sphère de Riemann. Plus généralement, on 
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fig- 9 



Surface de genre 2 


peut définir la notion d’application holo- 
morphe d’une courbe analytique complexe 
dans une autre. 

Deux courbes analytiques sont dites 
isomorphes ou conformément équivalen- 
tes s’il existe un homéomorphisme holo- 
morphe de l’une sur l’autre ; il est facile de 
voir que l’application réciproque d’un tel 
homéomorphisme est aussi holomorphe. 
Le théorème de représentation conforme 
de Riemann se généralise ainsi : 

Toute courbe analytique complexe 
connexe et simplement connexe est iso- 
morphe à l’une des suivantes : 

a) La sphère de Riemann (droite pro- 
jective complexe) ; 

b) Le plan C (droite affine complexe) ; 

c) Le disque unité (ou le demi-plan). 

On distingue aisément les cas ci, b, t\ car 

la sphère est la seule à être compacte, et le 
disque unité le seul à admettre des fonc- 
tions holomorphes bornées non constan- 
tes. Le revêtement universel d’une courbe 
analytique complexe connexe X est iso- 
morphe à l’une des courbes précédentes ; 
si c’est la sphère, la courbe X est elle-même 
isomorphe à la sphère ; si c’est le plan, 


alors X est isomorphe au plan ou au plan 
privé d’un point, ou bien est une courbe 
elliptique. 

Une application holomorphe non cons- 
tante / : X * Y est toujours ouverte. Ses 
fibres f 1 (}’) (j E Y) sont discrètes et, pour 
tout point x E X, il existe des cartes cp et 
tp de X et Y définies respectivement dans 
des voisinages de x et de J‘(x) telles que 
(f (x) = 0, l \)(f (x)) = 0 et que ip o / o cp - ' 
soit de la forme z - \ où n est un entier 

1, que l’on appelle l’indice de ramifi- 
cation de / en x ; en général n = 1 , et 
l’ensemble des points de X où l’indice de 
ramification est > 2 (points de ramifica- 
tion def’) est discret. Par exemple, l’appli- 
cation ; ^ : 2 de C dans C est ramifiée 
seulement en 0, avec 2 comme indice de 
ramification ; si on la prolonge à la sphère 
de Riemann en posant oo 2 — oo, on obtient 
une application holomorphe de la sphère 
de Riemann sur elle-même, ramifiée en 0 
et en oc, et dont les fibres au-dessus des 
points ^ 0, oo ont toutes 2 points. L’image 
réciproque, par cette application, du plan 
fendu C-R + , se compose de 2 
« feuillets » isomorphes au plan fendu (ils 
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correspondent aux 2 déterminations de 

z 12 , fïg. 10). 



On appelle surface de Riemann une 
courbe analytique connexe X munie d’une 
application holomorphe non constante à 
valeurs dans la sphère de Riemann ; ainsi 
(S2, Z z 2 ) est une surface de Riemann, 
grâce à laquelle il est possible de prolonger 
analytiquement une branche holomorphe 
de la racine carrée : une telle branche est 
définie initialement dans le plan fendu, mais 
on peut la considérer comme définie dans 
l’un des 2 feuillets de la surface de Riemann 
(c’est alors l’application identique de la 
sphère de Riemann), ce qui permet de 
définir un prolongement analytique sur la 
surface de Riemann. D’une manière géné- 
rale, le prolongement analytique d’une 
fonction holomorphe définie dans un 
ouvert de C conduit à construire une sur- 
face de Riemann sur laquelle on peut défi- 
nir ce prolongement. Ainsi la fonction ln est 
définie sur la surface de Riemann (C, 
z ► e r ), dont l’image est C — { 0 } ; cette 
surface de Riemann n’est ramifiée en aucun 


point et a une infinité de feuillets. La surface 
de Riemann de la fonction algébrique y de 
X définie par l’équation : 

y 2 = 4* 3 + bx + c 

(avec -f- 27 c 2 # 0) est la courbe d’équa- 
tion homogène : 

y 2 t = 4 x 3 + bxt 2 + et 3 

dans le plan projectif complexe P,(C), 
munie de l’application dans la sphère de 
Riemann P 3 (C), qui transforme le point 
(x, y, t ) en (x, t ) pour t 7^ 0 et le point 
(0, 1, 0) en (1,0) = 00 (coordonnées 
homogènes) ; elle a 2 feuillets et est 
ramifiée au-dessus des solutions de 
4 x 3 + bx f- c = 0 ; en paramétrant la 
courbe à l’aide des fonctions elliptiques 
X = p(u), y = p’(u) (u G C), on voit 
qu’elle est isomorphe au quotient de C par 
un sous-groupe discret de rang 2 (courbe 
elliptique, cf. la partie A ci-dessus Fonc- 
tions elliptiques et modulaire). 

Riemann a démontré que toute surface 
de Riemann compacte est la surface de Rie- 
mann d’une fonction algébrique. Autre- 
ment dit, toute courbe analytique complexe 
compacte est isomorphe à une courbe algé- 
brique d’un certain espace projectif com- 
plexe (cf. COURBES ALGÉBRIQUES). Il est 
remarquable que le genre topologique de la 
courbe analytique considérée est égal au 
genre algébrique de la courbe algébrique 
isomorphe ; dans l’isomorphisme, les fonc- 
tions ou les formes différentielles méromor- 
phes sur la courbe analytique s’identifient 
aux fonctions ou aux formes différentielles 
rationnelles sur la courbe algébrique. 
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GAMMA FONCTION 


I ntroduites pour la première fois comme 
nouvelles transcendantes par L. Euler, 
la fonction gamma et la fonction bêta, qui 
s’y ramène, sont les plus importantes 
« fonctions spéciales » étudiées, au fur et à 
mesure des besoins, depuis le XVIII e siècle. 
C’est ainsi que la fonction gamma inter- 
vient dans de nombreuses estimations 
asymptotiques des « grands nombres », en 
statistique notamment ; elle intervient 
aussi dans la théorie des séries de Dirichlet 
(cf. théorie des nombres Théorie analy- 
tique ; fonction ZÊTA). 

Nous avons choisi ici d’aborder la 
fonction gamma dans le domaine réel. 
Appliquant le principe du prolongement 
analytique (cf. fonctions ANALYTIQUES 
Fonctions analytiques d’une variable com- 
plexe, chap. I), on obtient ensuite l’exten- 
sion au champ complexe de la plupart des 
formules. 
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La fonction gamma 
dans le domaine réel 
Une intégration par parties montre faci- 
lement que, pour tout entier positif n , on 
a : 

( 1 ) 1.2.3 . . . (n — 1 )« = n ! ; 

mais l’intégrale (1) garde un sens pour 
des valeurs non nécessairement entières 
de n , d’où l’idée d’extrapoler ainsi la suite 
des factorielles. On pose traditionnelle- 
ment : 

(2) V{x) = j~e-‘t x - l dt 


(intégrale eulérienne de seconde espèce), 
forme due à Euler (1781). Pour X > 0, 
cette intégrale est convergente au voisi- 
nage de 0, car e 7' 1 ~ t x 1 pour x 
tendant vers 0, avec x — 1 > — 1 ; la 
convergence pour l’infini résulte de la 
présence du terme exponentiel e~ l . En fait, 
on peut montrer que l’intégrale (2) et 
toutes les intégrales obtenues en dérivant 
un nombre quelconque de fois par rapport 
à x sous le signe d’intégration sont 
uniformément convergentes au voisinage 
de 0 et de -J- oo. La fonction T est donc 
indéfiniment dérivable pour x > 0, de 
dérivées : 



t)„e-t t x-\dt 


Remarquons qu’avec la définition (2) 
on a, en tenant compte de (1) : 

1-(1) = 1 , r(#i)= (n — 1 ) !, 


Relation fonctionnelle et graphe 
Remplaçant X par x + 1 dans (2) et 
intégrant par parties, on obtient : 


t t x dt - 


A +x [ A e-*t*~'dt 

a V0 


=e~ a a x — e~ A A* +x dt, 

ce qui donne, en faisant tendre a vers 0 et 
A vers l’infini, la relation fonctionnelle : 


(3) T{x + 1) = xV(x) 

Par récurrence, on en déduit facile- 
ment : 


rm . r(x+«) 

UJC,_ X(X+ i) ...(* + »)’ 

cette relation permet de définir F (x) pour 
X réel négatif, — H <x< — n + 1 . On a 
ainsi défini T(x) pour tout nombre réel X 
qui n’est pas un entier négatif ou nul. 

La fonction In F est convexe sur 
]0, +oc] ; en effet, l’inégalité de Schwarz 
montre que : 

r 2 ^ rr w , 

d’où (ln T)" ^ 0. A fortiori, la fonction F 
est convexe. Comme F (2) = F (1) = U la 
fonction F atteint son minimum sur RT en 
un point compris entre 1 et 2. La figure 1 
représente le graphe de cette fonction. 

Formules d* Euler et de Weierstrass 
Pour n tendant vers l’infini, 



tend vers e ' pour tout f, et cela suggère la 
formule (qu’il faut, bien entendu, démon- 
trer rigoureusement) : 


ce qui suggère la convention généralement 
adoptée 0 ! = 1. 



- u ) n du 


x > 0, 
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produit (x + 1 )...(* -j- n) par l’entier cor- 
respondant pris dans n !, on a donc : 

fôô ni 1 

" A = 1 

(5) =xev JJ + Ÿ) e ~ x/k ’ x > °> 

k = I 

puisque le produit infini est convergent (cf. 
séries et produits infinis) * ce dévelop- 
pement en produit infini a été obtenu par 
Weierstrass. 

Comportement asymptotique 
Le comportement de la fonction gamma 
lorsque la variable x tend vers l’infini est 
décrit par la formule de Stirling : 

(6) r(x + 1) ~ x x e~ x V2nx,x ^ ► + °°, 


la seconde intégrale s’obtenant en fai- 
sant le changement de variable / = nu 
dans la première. Or, un calcul facile 
montre que : 

B(x, n + i) = JJ u) n du 

= — — , x>0; 

x{x + 1) ... (x + n) 

d’où la formule d'Euler : 


(4) r(x) 


lim 

n — ao 


n x n i 

x (x + i) . . . (x + n)' 


x > o. 


Pour transformer cette expression, on 
peut écrire : 

fjx — gxh vt — gx(lrvt — 1 — 1/2 — çX /\ qx /2 /n . 


qui donne, en particulier, un « infiniment 
grand » équivalent à la factorielle : 

n ! — n n e~ n V 2 tt n> n — » ► + 

on peut d’ailleurs préciser plus étroitement 
le comportement asymptotique de r(x) (cf. 
calculs ASYMPTOTIQUES). 

Indiquons maintenant une formule due 
à Legendre pour p = 2 et à Gauss dans le 
cas général : 

formule de Legendre-Gauss ; 

= (2 tt ^- 1 )/2 p - x + 1/2 T ( x ), 

pour tout entier p > 1. Pour p = 2, on a 
donc : 


or la quantité : 

1 +1+ + ~ ln« 

tend vers une limite y (la célèbre constante 
d’Euler y — 0,577 2) lorsque n tend vers 
l’infini. Divisant chacun des termes du 



Intégrales eulériennes 

De nombreuses intégrales définies s’expri- 
ment au moyen de la fonction gamma. 
C’est ainsi que, pour les intégrales eulé* 
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riennes de première espèce (fonction bêta), 

x > 0 et y > 0 : 

(8) B(x,y) = ty-'dt, 

à partir de la formule (4), Euler a établi la 
formule fondamentale : 


B (x,y) 


fbffi)- 

r(x + y y 


on en déduit beaucoup d’autres résultats. 
Par exemple, si on effectue le changement 
de variable u = sin 2 t, on obtient : 


1 î cos 2 *' - 1 tdt , 


1 T:f\- l t r(x)ro,) 
-2 B(X ’ y) -2r<x+y) 

Faisant x = y = 1/2 dans la formule 
précédente, on obtient la valeur : 


r 


î 

02 


= VÎT, 


qui permet, en utilisant (3), de calculer plus 
généralement T(« + 1/2). 


simples, sont ces points n. La formule 

(9) est la factorisation de Weierstrass de la 
fonction entière 1 jF (cf. FONCTIONS Ana- 
lytiques Fonctions analytiques d’une 
variable complexe, chap. 9). 

Le principe du prolongement analyti- 
que permet alors de voir que de nombreu- 
ses formules établies ci-dessus pour x réel 
positif restent vraies pour z complexe. Par 
exemple la relation fonctionnelle s’écrit : 

(10) r(z + i) = z r(z) ; 


la formule (7) de Legendre-Gauss s’étend 
également. D’autre part, de (9) résulte 
facilement, en faisant à l’envers le calcul du 
chapitre 1, que l’on a pour tout z : 


(H) ‘ lim Z(Z+ ÏL4+JH , 

T(z) n^n\ 

où n z — e z ^ n est fonction entière de z. 
Enfin, pour tout nombre complexe z de 
partie réelle strictement positive, on a : 


(12) r \z) = f 

Jo 


Extension au champ complexe 
La formule de Weierstrass (5) garde un 
sens lorsque la variable x prend des valeurs 
complexes. En effet, on montre par 
des majorations que le produit infini de 
terme général (1 + zjn)e~ :/n = 1 + n n (z) 
converge normalement (cela signifie que la 
série de terme général u n (z) converge 
normalement) dans tout disque Z ^ R. 
Ce produit infini définit donc une fonction 
de Z analytique dans tout le plan complexe. 
Nous poserons par définition : 

^ W)= zev ii{ x+z ï) e - i,n ' 

cette fonction admet les points — n, n E: N, 
pour zéros simples, et, par suite, la fonc- 
tion V(z) est méromorphe et ses pôles, 


l’intégrale étant uniformément conver- 
gente pour 0 < a ^ Re z ^ M. 

La convergence étant normale dans (9), 
on obtient, en prenant la dérivée logarith- 
mique des deux membres : 


( 13 ) 


HQ 

r(z) 




Z 

n(z + nj’ 


pour z ^ n, n G N, la convergence étant 
normale sur tout compact de C — (— N). 


La formule des compléments 

À partir de (11) et du développement 

eulérien de sin z (cf. EXPONENTIELLE ET 
LOGARITHME, chap. 5) : 

(i4> ù*=*n(i-,4). 
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on obtient l’importante « formule des com- 
pléments » due à Euler : 


GAMMA FONCTION 


(15) 


r(z)r(i-z) = 


zec. 


Appliquons, par exemple, cette formule 
pour Z = it, t réel. On a alors T( 1 it ) 
= — it H- it ) = — it T(it ) d’après (10), 
d’où r(/f ) 2 = TCjt sh t . 

La formule des compléments peut aussi 
s’obtenir directement, sans utiliser (13), à 
partir d’une représentation, due à Hankel, 
de l/r(z) comme intégrale curviligne le 
long d’un «chemin sans fin » : cette 
formule (16) sert d’ailleurs dans de nom- 
breuses questions relatives à la fonction 
gamma. 

Désignons par U l’ensemble des nom- 
bres complexes privé des réels négatifs ou 
nuis. Pour z G C et il G U, il' désignera la 
détermination principale de cette fonction 
dans U, soit U : = e :ln M , où ln u représente 
la détermination principale du logarithme 
dans U, réelle pour u réel positif. Soit alors 
L : R - U un chemin sans fin dans U 
défini par L(t ) = r(t )é’ /v ^, où r(t) tend 
vers l’infini lorsque t tend vers ± oo, on 
suppose qu’il existe £ > 0 tel que : 


- + e^v(f)<n , et — tt < v(r) < — ~ — e 


au voisinage de + oo et de — oo respecti- 
vement (fig. 2). On a alors : 


( 16 ) 


1 

EOO 


1 

2in 


i 


u~ z e u du. 


Interprétation par la théorie 
des groupes 

Le corps R des nombres réels est locale- 
ment compact et les caractères du groupe 
additif R (cf. analyse harmonique, 
chap. 4) sont de la forme : 

t ^e~ ut , uE C. 



La composante connexe du groupe mul- 
tiplicatif du corps R est le groupe RT, dont 
la mesure invariante est dtjt. Les caractères 
du groupe multiplicatif sont de la forme : 

r SEC. 

Si on cherche à décomposer un carac- 
tère additif selon les caractères du groupe 
multiplicatif, on est conduit à étudier l’inté- 
grale sur R* (transformée de Laplace, 
appelée aussi transformée de Mellin) : 



qui converge pour Re s > 0 et Re u > 0. 
Le changement de variable ut — X joint à 
une intégration dans le champ complexe 
suivant le contour indiqué dans la fig. 2, 
suivi d’un passage à la limite pour £ — ► 0 
et R-— ► + oo (on applique le théorème de 
Cauchy), conduit à la relation : 


( 17 ) 


» dt 1 , x 

e~ut t s ~ = — r (s), 

t «j v 7 


où u s = exp In u ), en désignant par ln u 
la détermination principale du logarithme. 
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Le point de vue précédent montre 
l’analogie entre la fonction gamma et les 
sommes de Gauss, en arithmétique, où on 
considère l’anneau fini Z/wZ des entiers 
modulo n et le groupe multiplicatif G„ de 
ses éléments inversibles. Ces deux cas 
relèvent de l’analyse harmonique dans les 
anneaux localement compacts. 

La formule (17) permet en outre 
d’exprimer les caractères du monoïde mul- 
tiplicatif N, à savoir : 



à l’aide des caractères t ^ e nt du groupe 
additif R par la formule : 


(17') 


_1_ 

n s 


1 

n s) 



On en déduit qu’une série de Dirichlet 
peut s’écrire comme transformée de Mel- 
lin d’une série entière : 


(18) 





La fonction gamma permet ainsi de rame- 
ner certains problèmes d’arithmétique 
multiplicative à des problèmes additifs. En 
particulier, la célèbre fonction zêta, inter- 
venant dans la théorie des nombres pre- 
miers, peut s’écrire sous la forme : 


(19) 


C(i) r(i> 


r 



dt. 


qui est à la base de la théorie de Riemann. 


JEAN-LUC VERLEY 
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GÉOMÉTRIE 


L a géométrie est communément définie 
comme la science des figures de 
l’espace. Cette définition un peu incertaine 
risque de conduire à inclure dans la 
géométrie des questions qui ne sont géo- 
métriques que dans leur langage, mais 
relèvent en fait d’autres domaines. Tel est 
le cas de l’algèbre géométrique des Grecs 
qui parlait du « rectangle » de deux seg- 
ments pour qualifier le produit de deux 
nombres. Jusqu’au début des Temps 
modernes, presque toute la mathématique 
s’exprimait géométriquement : ainsi la 
Géométrie de Descartes traite non seule- 
ment de géométrie, mais aussi des équa- 
tions algébriques. Et, au XIX e siècle, les 
mathématiciens étaient encore bien sou- 
vent qualifiés de géomètres, même quand 
ils étaient de purs analystes ou algébristes. 

Plus délicat, en revanche, est le cas des 
domaines mixtes où des questions au 
départ incontestablement géométriques 
apparaissent très vite ne constituer qu’un 
chapitre de l’algèbre ou de l’analyse, et ne 
pouvoir être correctement traitées que par 
les moyens de ces disciplines. Ainsi se 
présentent le calcul des surfaces, le calcul 
des volumes, la détermination des tangen- 
tes à une courbe, et, plus généralement, 
l’ensemble de la géométrie infinitésimale. 
Historiquement, ces questions relevèrent 
de la géométrie pure, mais leur caractère 
abstrait devait bientôt se dégager et être 
retenu comme premier. Pourtant, ces deux 
modes d’approche sont trop intimement 
liés pour que l’on puisse songer à les 
séparer ; en outre, par son caractère infi- 
nitésimal, ce domaine se distingue assez 
nettement des autres branches de la géo- 
métrie qui sont à peu près exclusivement 
de caractère « fini ». Aussi n’en sera-t-il pas 
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question, sans que soit oubliée pour autant 
l’existence d’une géométrie infinitésimale 
« directe » où ont excellé, au XVII e siècle, 
Pierre de Fermât et Pascal, au XVIII e siècle, 
Jean-Baptiste Meusnier de La Place, au 
XIX e siècle, Charles Dupin, et qui, même au 
XX e siècle, notamment avec les travaux de 
Georges Bouligand, demeure un champ de 
recherches certes assez limité, mais digne 
d’ attention. 

Pour des raisons similaires on ne retien- 
dra ni la géométrie algébrique ni la trigo- 
nométrie, bien que le point de vue infini- 
tésimal n’y soit pas aussi dominant, 

Ainsi délimitée, la géométrie a un 
objectif fondamental assez homogène qui 
est l’étude des figures au sens le plus large, 
bien qu’elle soit fort diverse dans ses 
méthodes et dans ses points de vue. 

Depuis Descartes, la géométrie SCSt 
développée dans deux directions nette- 
ment distinctes : la géométrie analytique et 
la géométrie dite « pure » ou encore « syn- 
thétique ». La conception de l’une et de 
l’autre, ainsi que celle de leurs rapports, a 
connu des vicissitudes qui constituent l’un 
des aspects les plus intéressants de l’his- 
toire moderne de la géométrie. On a pu 

notamment assister aux efforts de la géo- 
métrie pure pour sauvegarder une auto- 
nomie que menaçait sans cesse davantage 
le développement de l’algèbre et de l’ana- 
lyse. Un de ses derniers bastions, la chaire 
de géométrie pure de l’École polytechni- 
que de Paris, a été supprimé en 1956. 

Aujourd’hui, bien qu’elle soit encore vala- 
ble à plus d’un titre, principalement en 

raison du rôle qu’y jouent l’imagination et 
l’intuition, la géométrie pure n’occupe plus 
qu’une place seconde dans la mathémati- 
que. 

De caractère plus intrinsèque apparaît 
le pluralisme de la géométrie qui s’est 

manifesté, surtout depuis le début du 


XIX e siècle, avec la constitution de la 
géométrie projective en discipline auto- 
nome et avec la naissance des géométries 
non euclidiennes. Diversité qui fut pleine- 
ment comprise et dominée par le mathé- 
maticien allemand Félix Klein, dans son 
célèbre programme d’Erlangen. 

La diversification devait s’accentuer 
lorsque, se libérant plus nettement encore 
de l’espace physique euclidien où elle était 
demeurée enfermée depuis plus de deux 
millénaires, la géométrie, d’une part, s’est 
étendue aux espaces à plus de trois dimen- 
sions et, d’autre part, a intégré systémati- 
quement les éléments imaginaires, Dans 
une étape ultérieure, la géométrie devait 
« éclater » pour s’insérer dans les deux 
grandes structures générales de la mathé- 
matique moderne, l’algèbre et la topologie. 

Dès lors, on peut comprendre les vraies 
raisons de l’incertitude qui a pesé, tout au 
long de l’histoire de la géométrie, sur sa 
nature et sur ses rapports avec les autres 
domaines de la mathématique. On com- 
prend mieux également pourquoi, très tôt, 
elle s’est sentie menacée dans son autono- 
mie par le développement de l’algèbre et 
de l’analyse, et pourquoi, finalement, en 
dépit du constant effort d’unification qui 
marque son histoire, notamment avec 
Euclide, Apollonios, René Descartes, 
Gérard Desargues, Jean Victor Poncelet, 
Michel Chasles, elle était condamnée à 
disparaître comme discipline autonome, 
pour ne plus être qu’une « illustration » 
des structures abstraites de la mathémati- 
que moderne. 

Du très grand nombre de questions et 
de problèmes qui se rencontrent dans la 
géométrie, on retiendra essentiellement les 
fondements, les principes, les notions 
majeures et les théorèmes les plus impor- 
tants. 
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1. La géométrie classique 

La synthèse euclidienne 

On rencontre déjà en Égypte ancienne, à 
côté d’une pratique géométrique, un début 
de science géométrique, comprenant 
notamment diverses propositions sur les 
propriétés du triangle et du cercle. Plus 
tard, en Grèce, principalement avec Thalès 
au VI e siècle avant J.-C., Pythagore et 
Hippocrate de Khios au V e siècle, Eudoxe 
au iv’ siècle, un nombre appréciable de 
résultats géométriques sont obtenus : ins- 
cription de sphères dans un cône, simili- 
tude des triangles, principales propriétés 
du cercle, polygones et polyèdres réguliers, 
sections coniques. Utilisant ces données et 
les complétant, Euclide (fin du IV e siècle av. 
J.-C.) réalise avec ses Éléments la première 
synthèse de la géométrie. 

En fait, les Eléments comportent, à côté 
de la géométrie proprement dite, d’impor- 
tants chapitres qui n’en relèvent aucune- 
ment (nombres entiers, nombres irration- 
nels, proportions, équations du premier et 
du second degré), ou qui n’en relèvent pas 
au sens restreint retenu ici pour la géomé- 
trie, savoir la détermination des surfaces et 
des volumes. 

Outre leur caractère organique, les 
Eléments ont ceci de remarquable que leur 
auteur a le souci de « fonder » la géomé- 
trie : ils débutent par une série d’ énoncés 
de base, à partir desquels sont déduites 
toutes les autres propositions. Une telle 
innovation procède essentiellement des 
préoccupations et de l’œuvre logique 
d’Aristote. 

Ces énoncés se répartissent en trois 
catégories : des définitions (point, ligne 
droite, surface, angles...), des vérités consi- 


dérées comme évidentes, et, de ce fait, 
n’appelant pas de démonstration (deux 
grandeurs égales à une même grandeur 
sont égaies entre elles, le tout est plus grand 
que la partie...), des demandes ou postu- 
lats, vérités non évidentes par elles-mêmes, 
que l’on ne sait pas démontrer, mais dont 
on a besoin du fait que les théorèmes que 
l’on en déduit apparaissent vérifiés concrè- 
tement. 

La plus importante et la plus célèbre de 
ces demandes est le postulat des parallèles 
qui affirme » à la formulation près - que, 
par un point situé hors d’une droite, on 
peut mener une droite et une seule qui ne 
la rencontre pas, cette droite étant dite 
parallèle. 

Une autre demande de grande portée, 
que l’on trouve seulement dans le corps de 
l’ouvrage, est le postulat dit d’Archimède, 
qualifié aujourd’hui de postulat de conti- 
nuité : Deux points A et B étant donnés sur 
une droite, si, à partir de A, l’on met à la 
suite des segments de même longueur, on 
dépassera le point B après une série finie 
de telles opérations, si petite que soit cette 
longueur. 

Il existe en réalité une certaine hésita- 
tion chez Euclide et ses successeurs quant 
à la nature exacte de ces « demandes ». Les 
uns estiment qu’elles sont suffisamment 
évidentes pour n’avoir pas à être démon- 
trées. D’autres, au contraire, pensent que 
l’on doit pouvoir les démontrer et que la 
géométrie ne sera vraiment satisfaisante 
que lorsque l’on y sera parvenu. C’est cette 
dernière opinion qui l’emporta, donnant 
lieu aux tentatives infructueuses de 
démonstration qui occupèrent tant de 
géomètres jusqu’à la naissance des géomé- 
tries non euclidiennes. 

En dehors du postulat des parallèles, la 
géométrie euclidienne a été longtemps 
considérée comme le modèle même d’une 
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connaissance vraie et rigoureuse. 
Aujourd’hui, ses fondements se révèlent, à 
bien des égards, très peu assurés. Les 
définitions d’Euclide ne sont pas de vraies 
définitions, mais plutôt des descriptions 
d’intuitions ; elles utilisent des concepts 
qui sont considérés comme premiers, alors 
qu’ils demandent eux-mêmes à être définis. 
Tel est le cas des définitions du point 
comme ce qui n’a pas de partie, de la ligne 
comme longueur sans largeur, de la ligne 
droite comme celle qui est située sembla- 
blement par rapport à tous ses points, de 
l’angle plan comme l’inclinaison mutuelle 
de deux lignes qui se rencontrent dans un 
plan et qui ont des directions différentes. 

C’est seulement à la fin du XIX e siècle, 
surtout avec David Hilbert (1862-1943), 
dans Principes fondamentaux de lu géomé- 
trie (Grundlagen der Geometrie, 1899) que 
la géométrie euclidienne est fondée de 
façon satisfaisante par une démarche déga- 
gée de toute intuition sensible, et Hilbert 
démontre préoccupation étrangère à 
Euclide - que les axiomes retenus sont 
indépendants et qu’ils ne conduisent pas à 
des contradictions. Ensuite, des mathéma- 
ticiens, tel Gustave Choquet dans L’Ensei- 
gnement de lu géométrie (1964), ont exposé 
la géométrie euclidienne sous une forme 
élémentaire mais rigoureuse. 

La présentation moderne des axiomes 
de la géométrie euclidienne offre, en plus 
de sa rigueur logique, la supériorité sur 
celle d’Euclide de faire apparaître ce que 
Georges Bouligand a appelé la « causa- 
lité » des propositions : on est en mesure 
de désigner les axiomes qu’utilise une 
proposition donnée, certaines proposi- 
tions ne faisant pas appel à l’ensemble des 
axiomes. Ainsi, en abandonnant le postulat 
des parallèles on obtient des propositions 
qui sont valables aussi dans les géométries 
non euclidiennes, et l’on peut construire 


des géométries « non archimédiennes » où 
le postulat d’Archimède n’est pas vérifié. 
C’est dans cette perspective que se situe la 
conception des géométries subordonnées 
de Klein dont il est question plus loin. 

La sphère 

La géométrie de la sphère, principalement 
pour les besoins de l’astronomie, devait 
être particulièrement développée dès 
l’Antiquité grecque. Elle constitue, 
jusqu’au début des Temps modernes, un 
savoir assez autonome par rapport aux 
autres aspects de la géométrie. Très tôt, 
même avant les Grecs, furent étudiés dans 
le cercle et la sphère les rapports entre les 
cordes et les angles. Dans les Sphériques , 
Menelaos d’Alexandrie (I er siècle apr. 
J.-C.) démontre un important théorème, 
valable non seulement pour les triangles 
sphériques, mais aussi pour les triangles 
plans : Si un triangle sphérique (resp. un 
plan) est coupé par un grand cercle (resp. 
une droite), les trois points d’intersection 
L, M, N, sont tels que les produits des sinus 
des arcs (resp. les segments) sans points 
communs sont égaux aux produits des trois 
autres. À partir de ces résultats prendra 
naissance la trigonométrie plane et sphé- 
rique. 

Les « Coniques » d'Apollonios 

Avec les Eléments d’Euclide et les écrits 
d’Archimède, les Coniques d’Apollonios 
de Perge (fin du m e siècle av. J.-C.) 
constituent l’un des ouvrages les plus 
complets et les plus remarquables qu’a 
légués la mathématique grecque. Apollo- 
nios y présente en un ensemble organique 
des notions et des résultats pour une part 
notable antérieurs à lui, mais auxquels il a 
joint d’importantes contributions. Apollo- 
nios unifie la définition des coniques : au 
lieu d’utiliser pour chaque catégorie de 
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coniques un cône à base circulaire différent 
(obtusangle pour l’hyperbole, droit pour la 
parabole, acutangle pour l’ellipse), il ne fait 
appel qu’à un seul cône à base circulaire. 
On lui doit aussi la dénomination des trois 
types de coniques. Alors qu’avant lui on ne 
prenait en considération qu’une seule 
branche de l’hyperbole, il définit l’hyper- 
bole comme constituée de deux branches. 
Retenons aussi parmi les apports origi- 
naux d'Apollonios son étude des condi- 
tions d’égalité et de similitude des coniques 
et de la disposition de ces courbes sur un 
cône donné. En dehors des éléments nou- 
veaux sur les coniques qu’apportera la 
géométrie projective, l’ouvrage d’Apollo- 
nios diffère peu mis à part la prolixité des 
explications, due surtout à l’absence de 
notations de l’enseignement sur les 
coniques qu’on dispensait en France, dans 
les années soixante, en classe de mathé- 
matiques élémentaires. 

2. La géométrie analytique 
Origines 

Il est assez habituel de considérer que la 
géométrie analytique a été créée par Des- 
cartes. En réalité, cette vue est trop simple. 
Si la « géométrie analytique » est prise au 
sens moderne de l’expression, celle de 
Descartes en était encore assez éloignée. 
D’autre part, plusieurs éléments caracté- 
ristiques de la géométrie analytique 
avaient été formulés avant Descartes. 

La géométrie analytique paraît consis- 
ter dans l’association de trois facteurs : 
l’expression d’une réalité géométrique par 
une relation entre des quantités variables, 
l’usage des coordonnées, le principe de la 
représentation graphique. Or, si chacun de 
ces trois facteurs se rencontre assez tôt 
dans le développement de la géométrie 


avant Descartes, ils n’ont cependant pas 
été rapprochés. 

Dès la plus haute antiquité, l’observa- 
tion astronomique avait conduit à repérer 
les directions dans l’espace par deux coor- 
données angulaires : hauteur au-dessus de 
l’horizon, écart par rapport au méridien. 
Et, très tôt, furent mises en évidence des 
relations entre ces coordonnées. Mais il 
s’agissait là de pratiques qui étaient à peu 
près sans rapport avec la science géomé- 
trique. Au contraire, c’est au cœur même 
de la géométrie que l’on voit intervenir 
chez les Grecs un calcul portant sur deux 
variables en vue de caractériser des réalités 
géométriques et d’en établir les propriétés. 
Chez Archimède et surtout chez Apollo- 
nios, un tel calcul est développé systéma- 
tiquement pour l’étude des coniques. Apol- 
lonios écrit explicitement les équations des 
coniques en coordonnées obliques ayant 
pour origine un point de la conique et pour 
directions le diamètre correspondant à ce 
point et son diamètre conjugué : 

y 2 - 2px + P ~x 2 , 

y 2 = 2 px— P x 2 , 

a 

y 2 = 2 px, 

pour l’hyperbole, l’ellipse et la parabole 
respectivement. 

Dans une perspective tout à fait diffé- 
rente. Nicolas Oresme, au XIV e siècle, 
imagine une représentation graphique de 
certains phénomènes. Il distingue une 
latitude) et une longiîudo qui correspondent 
à l’abscisse et à l’ordonnée d’une repré- 
sentation en coordonnées rectangulaires. 
Cette façon de faire est inverse de celle des 
Grecs, puisque OreSttie ne part pas d’une 
réalité géométrique mais exprime sous 
forme géométrique une relation entre des 
grandeurs. La conception même d’une 
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telle correspondance doit être considérée 
comme s’inscrivant dans le cadre des idées 
qui sont à la base de la géométrie analy- 
tique. Toutefois, les vues d’Oresme, en 
dépit de la grande faveur qu’elles connu- 
rent, ne furent aucunement rapprochées 
des pratiques « analytiques » des Grecs 
dont l’Occident prit connaissance vers la 
fin du XVI e siècle avec la publication en latin 
des œuvres d’Archimède et d’Apollonios. 

Descartes et Fermât 

Le calcul géométrique exposé par Descar- 
tes (1596-1650) dans sa Géométrie (1637) 
ne diffère guère en son principe du calcul 
d’Apollonios. Il porte sur deux variables 
que l’on peut sans doute considérer 
comme constituant des coordonnées ; 
mais on n’y trouve pas explicités des axes 
de coordonnées, c’est-à-dire deux droites 
orientées, distinctes des lignes de la figure. 
Toutefois, dans quelques passages de son 
ouvrage, Descartes précise qu’il choisit sur 
une droite, distincte de la figure, un point 
origine ; mais il ne fait pas intervenir un 
autre axe de coordonnées, se contentant de 
choisir une direction selon laquelle est 
mesurée la seconde variable. 

Le vrai progrès réalisé par Descartes 
réside en ce que, au lieu de limiter un tel 
calcul à l’étude d’une figure donnée, 
comme le faisaient les Grecs, il le pose en 
procédé général susceptible de permettre 
la création d’une infinité de courbes nou- 
velles Malheureusement, il limite singuliè- 
rement le champ de sa géométrie en 
refusant d’y recevoir les « courbes décrites 
par deux mouvements qui n’ont entre 
eux aucun rapport qu’on puisse mesurer 
exactement ». La formule signifie que Des- 
cartes ne reconnaît que les courbes algé- 
briques, excluant les courbes « transcen- 
dantes », dont l’étude commençait alors à 


se développer (logarithme, sinus et cosi- 
nus...). 

Il faut, d’autre part, noter qu’à la même 
époque, et même un peu avant lui, Pierre 
de Fermât (1601-1665) avait abouti à des 
conceptions fort voisines. Mais, alors que 
Descartes adopte des notations symboli- 
ques qui représentent les constantes et les 
variables par des lettres, et les puissances 
par des exposants, Fermât demeure atta- 
ché au langage beaucoup plus lourd de 
l’algèbre géométrique des Grecs. 

Descartes applique avec succès sa 
méthode à la résolution du problème dit de 
Pappus : Déterminer le lieu des points tels 
que, étant donné quatre droites et étant 
considéré les distances d’un point à chaque 
droite sous des angles déterminés, le pro- 
duit de deux distances est égal au produit 
des deux autres. Descartes montre aisé- 
ment par le calcul que ce lieu est une 
conique. 

La nouvelle méthode suscita dans la 
seconde moitié du XVII e siècle un grand 
nombre de travaux, concernant surtout les 
courbes planes algébriques (tangente, nor- 
male, centre de courbure, point 
d’inflexion...). 

La géométrie analytique moderne 

La géométrie analytique n’acquiert pleine- 
ment les traits qui la caractérisent 
aujourd’hui qu’au XVIII e siècle. Tout 
d’abord, alors qu’elle était demeurée limi- 
tée jusque-là au plan, la géométrie analy- 
tique est étendue à l’espace. En 1700, est 
écrite l’équation de la sphère ; en 173 1, 
Alexis Clairaut (17 13-1 765) publie une 
étude remarquable sur les courbes à double 
courbure. L’apport de Leonhard Euler 
(1707-1 783) est particulièrement notable : 
dans Introductio in analysis infinitorum 
(1748), pour la première fois, il énonce le 
principe de l’équivalence des deux axes, 
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alors que jusque-là l’axe des abscisses avait 
conservé, par une anomalie qui nous 
étonne, un rôle privilégié, et il donne une 
formule vraiment claire du changement de 
coordonnées, utilisée cependant par Yan 
Schooten dès 1649. De plus, Euler déter- 
mine l’équation des surfaces du second 
degré. 

La géométrie analytique ne prend 
cependant son essor que dans la seconde 
moitié du XVIII e siècle. Dans l’esprit de ses 
travaux sur la mécanique analytique, Louis 
de Lagrange (1736-1 8 13) souligne « avec 
combien de facilité et de succès la méthode 
algébrique peut être employée pour les 
questions qui paraissaient être le plus du 
ressort de la géométrie proprement dite et 
les moins propres à être traitées par le 
calcul ». Rompant avec la méthode carté- 
sienne qui mêlait les procédés analytiques 
et géométriques, les éléments du premier 
ordre (droite et plan) demeurant toujours 
envisagés de manière géométrique, 
Lagrange établit autour des années 1770 
les équations de la droite et du plan et 
inaugure F utilisation systématique de trois 
axes de coordonnées. 

C’est dans cet esprit que Gaspard 
Monge ( 1746 - 1818 ), à partir de 1771 et, 
plus systématiquement, en 1795 dans ses 
Feuilles cl analyse appliquée à lu géomé trie , 
donne à la géométrie analytique son 
ampleur, établissant les équations des 
divers types de surfaces algébriques (sur- 
faces réglées, développables, de révolu- 
tion...) et résolvant analytiquement de 
nombreux problèmes. On peut alors dire 
que la géométrie moderne est née. En 
1797, Sylvestre Lrançois Lacroix (1765- 
1843) en rédige le premier traité, mais sans 
encore user du terme même de géométrie 
analytique, intitulant son ouvrage : Traité 
de calcul différen tiel et in tégral 


Le XIX e siècle apporte peu de complé- 
ments notables à la géométrie analytique 
proprement dite. Mais le caractère arbi- 
traire du choix des axes de coordonnées 
devait conduire à l’étude des invariants 
dans les changements de coordonnées qui. 
seuls, peuvent exprimer les propriétés géo- 
métriques intrinsèques des figures. À côté 
des travaux d’ordre algébrique qu’elle 
contribua à susciter, cette étude fut un des 
facteurs principaux du développement, au 
cours du XIX e siècle, des notions de vecteur 
et de tenseur, dont l’utilisation allait être si 
féconde, non seulement en mathématique 
pure mais aussi dans de nombreuses appli- 
cations. 


3. La géométrie projective 

Au sens moderne du terme, on entend par 
géométrie projective l’étude des propriétés 
des figures qui se conservent par transfor- 
mation homographique. Ce point de vue 
général ne s’est dégagé que lentement, par 
élargissement de conceptions plus particu- 
lières et par une clarification qui a eu 
notamment à distinguer les propriétés 
projectives des figures de leurs propriétés 
métriques. La géométrie projective a joué 
un rôle majeur dans l’évolution de la 
conception de la géométrie. Elle fut le 
principal facteur du mouvement d’idées 
qui, au cours du xix’ siècle, a progressi- 
vement rapproché les diverses géométries 
et a donné à la notion de transformation 
une place centrale dans la géométrie. 

Le rapport anharmonique 
chez les Grecs 

Dans les mathématiques grecques, on ne 
rencontre pas à proprement parler de 
géométrie projective, essentiellement 
parce que la notion de transformation des 
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figures n’y apparaît pas, même pas la 
projection centrale que semble suggérer 
pourtant très naturellement la considéra- 
tion des cônes et de leurs intersections par 
des plans qui engendrent les coniques. En 
revanche, on trouve des notions et des 
théorèmes qu’on rattache maintenant à la 
géométrie projective. Principalement, la 
définition du rapport anharmonique, dit 
aujourd’hui birapport, de quatre points 
alignés A, B, C, D, soit : 


(A, B, C, D) = = : = . 

CB DB 


et la démonstration de la conservation de 
ce rapport pour les points d’intersection de 
toute transversale coupant quatre droites 
concourantes. Les Grecs se sont plus 
spécialement intéressés au rapport harmo- 
nique, cas particulier où le rapport anhar- 
monique a pour valeur 1. Ils le rencon- 
traient notamment dans l’étude des 
coniques, puisque, sur une droite quelcon- 
que passant par un point donné, ce point 
est conjugué harmonique de l’intersection 
de la droite joignant les points de contact 
des deux tangentes menées du point, par 
rapport aux deux points d’intersection de 
la droite avec la conique. Ces considéra- 
tions se trouvent dans les Coniques d’Apol- 
lonios et dans la Collection mathématique 
de Pappus d’Alexandrie (n e siècle apr. 
J.-C.). Il faut aussi mentionner, comme se 
rattachant à la géométrie projective, un 
certain nombre de théorèmes sur les seg- 
ments déterminés par des transversales à 
des triangles ou à des quadrilatères, prin- 
cipalement le théorème de Menelaos déjà 
énoncé. 


La perspective à la Renaissance 

En Europe, dès le xv’ siècle, les artistes, 
peintres et graveurs, s’intéressent surtout à 
la représentation sur un plan des figures de 


l’espace à partir du point de vue constitué 
par l’oeil. Ils sont ainsi amenés à l’étude de 
la projection centrale, et, en particulier, à 
la considération du point de fuite qui 
représente, sur le plan des projections, le 
point à l’infini de droites parallèles per- 
pendiculaires à ce plan. Il faut signaler les 
traités de perspective de Jean Pèlerin 
(1505) et d’Albert Dürer (1525). Dès le 
XV e siècle, les architectes, tels que Filippo 
Brunelleschi et Leon Battista Alberti, 
avaient contribué au développement de la 
perspective pratique. Des considérations 
de perspective se rencontrent également 
dans la gnomonique (art des cadrans 
solaires) et dans la stéréotomie ou taille des 
pierres. Plus tard, la perspective est déve- 
loppée pour les besoins des fortifications et 
de la « scénographie ». Mais elle demeu- 
rait encore au début du XVII e siècle une 
discipline sans rapport avec la science 
géométrique. C’est Desargues qui, le pre- 
mier, rapprochera ces deux ordres de 
recherches. 

Desargues et Pascal 

Le Français Girard Desargues (1593- 
1662), ingénieur et architecte, appartient 
au milieu des praticiens. Il a été en rapport 
avec les milieux savants de l’époque. Son 
souci d’une rationalisation et d’une sim- 
plification de la perspective par la mise en 
lumière de nouvelles méthodes géométri- 
ques l’amène, en 1639, deux ans après la 
Géométrie de Descartes, à publier 
Brouillon projet d’une atteinte des événe- 
ments des rencontres du cône avec un plan , 
petit ouvrage de quarante pages, tiré 
seulement à cinquante exemplaires. 
Rédigé de façon assez obscure, utilisant 
des termes nouveaux, qui, pour la plupart, 
ne seront pas retenus, cet opuscule est 
accueilli avec estime par Descartes et par 
Fermât ; pourtant ceux-ci n’en savent pas 
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reconnaître l’originalité et la portée ; il se 
heurte à de violentes oppositions, notam- 
ment, à celles d’auteurs de traités de 
perspective pratique. Seul Pascal ( 1623 - 
1662) comprend vraiment Desargues. Il 
voit en lui «un des grands esprits de ce 
temps et des plus versés aux mathémati- 
ques ». Pascal s’inspire très directement 
des vues de Desargues dans son Essay pour 
les coniques ( 1640 ), texte de quelques pages 
présentant déjà le vaste programme que 
développera le Traité des coniques, achevé 
entre 1654 et 1658, mais qui ne fut pas 
publié et dont il ne reste qu’un résumé et 
un commentaire dus à Leibniz. Philippe de 
La Hire (1640-1 7 18), dans deux traités sur 
les coniques (1673, 1679 ), reprend et 
systématise les idées et les résultats de 
Desargues et de Pascal sans y apporter 
toutefois des éléments notablement nou- 
veaux. 

Après La Hire et pendant près d’un 
siècle, la géométrie projective tombe dans 
l’oubli. Cela s’explique surtout par l’intérêt 
porté alors à la géométrie analytique pro- 
mue par Descartes et au développement 
du calcul infinitésimal auquel Leibniz et 
Newton venaient de donner son plein 
essor. 

La nouveauté de l’œuvre géométrique 
de Desargues réside essentiellement dans 
l’introduction, en géométrie, de la projec- 
tion centrale ; elle permet à ce mathéma- 
ticien des démonstrations « par le relief ». 
Ainsi, il démontre pour le cercle des 
propriétés relatives aux polaires et aux 
tangentes ; ensuite, par une projection 
centrale qui transforme le cercle en une 
conique, il les étend aux coniques. D’autre 
part, se fondant sur le fait que, dans une 
perspective, des droites parallèles se trans- 
forment en droites concourantes, Desar- 
gues complète l’espace euclidien, en défi- 
nissant les points à l’infini, qui seront 


considérés comme de même nature que les 
points à distance finie. Dès lors, Desargues 
pouvait substituer à l’étude séparée des 
trois catégories de coniques, selon la 
manière de faire d’Apollonios, une étude 
unique. 

On lui doit en outre l’introduction de la 
notion et du terme d’involution, 
étroitement liée à la notion de la division 
harmonique. Ces questions, on l’a vu, 
n’étaient pas ignorées des Grecs, mais elles 
n’avaient pas encore été étudiées systéma- 
tiquement. 

Au langage près, assez complexe chez 
lui parce que dépourvu de notations sym- 
boliques, Desargues définit l’involution sur 
une droite, ainsi qu’on le fait aujourd’hui, 
comme une correspondance symétrique et 
donc réciproque de deux points sur une 
droite. Elle s’écrit sous forme canonique 
xy = k. Tout couple de points d’une 
involution est conjugué harmonique des 
deux points doubles x = y = t + VX. 
Desargues envisage seulement le cas où ces 
points sont réels. Il montre aussi que deux 
couples de points définissent une involu- 
tion et il s’intéresse spécialement à l’ensem- 
ble constitué par trois couples de points en 
involution. Ces trois couples interviennent 
notamment dans un théorème relatif aux 
coniques, dont l’énoncé et la démonstra- 
tion représentent un apport remarquable 
de Desargues au progrès de la théorie des 
coniques. Ce théorème s’énonce ainsi : Les 
coniques d’un faisceau ponctuel défini par 
quatre points, dont trois quelconques ne 
sont pas alignés, déterminent sur chaque 
droite de leur plan des couples de points en 
involution ; les trois coniques dégénérées 
du faisceau qui sont les couples de côtés 
opposés du quadrilatère complet défini par 
ces quatre points satisfaisant à cette pro- 
priété. Desargues démontre ce théorème, 
d’abord dans le cas du cercle en utilisant 
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les relations de puissances, puis pour une 
conique quelconque en la considérant 
comme section plane d’un cône de base 
circulaire. Il semble qu’il faille chercher 
l’origine de ce théorème dans des lemmes 
de la Collection mathématique de Pappus 
d’Alexandrie ayant trait aux relations entre 
segments formés sur une transversale cou- 
pée par les trois couples de côtés opposés 
d’un quadrilatère complet. Mais Desar- 
gues est le premier à avoir considéré les 
coniques dans lesquelles est inscrit ce 
quadrilatère. 

Un autre de ses apports majeurs est le 
théorème sur les triangles « perspectifs » : 
Si, dans un même plan ou dans l’espace, 
deux triangles ABC et A’B’C’ sont tels que 
les trois droites joignant respectivement les 
trois couples de sommets homologues 
AA’, BB’, CC’ se rencontrent en un même 
point S, les trois points de concours des 
couples de droites portant les côtés homo- 
logues des deux triangles sont alignés. Et 
réciproquement. 

Desargues démontre ce théorème, dans 
l’espace, par des propriétés d’incidence, et, 
dans le plan, par l’emploi répété du théo- 
rème de Menelaos. 

Ce théorème de Desargues occupe une 
place fondamentale dans la structure de la 
géométrie projective ; ce que montre 
notamment le fait que sa démonstration 
dans le plan nécessite les postulats projec- 
tifs de l’espace comme l’a établit Hilbert 
dans ses Grundlagen der Geometrie le 
théorème de Menelaos utilisé par Desar- 
gues supposant ces axiomes. Hilbert a pu 
alors définir une géométrie projective 
plane « non arguésienne » où le théorème 
de Desargues n’est pas vérifié. 

L’importance de ce théorème se mani- 
feste aussi dans le fait qu’il est à la base de 
la définition de l’homologie dans le plan. 
Seulement entrevue par Desargues, cette 
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définition devait jouer un rôle capital dans 
les travaux de Jean Victor Poncelet (1788- 
1867). 

Soit en effet dans un plan P un trian- 
gle T projeté en un triangle T’ sur un plan 
P’ à partir d’un point 0 n’appartenant ni 
à P ni à P’. Rabattons le plan P sur P’ par 
rotation autour de la droite D, intersection 
des deux plans P et P’. T se rabat en un 
triangle T”. Les couples de droites joignant 
les côtés homologues des triangles T’ et T” 
du plan P’ se rencontrent évidemment sur 
D dont les points sont demeurés inchangés 
aussi bien dans le rabattement que dans la 
projection. Ces trois points étant donc 
alignés, il en résulte, d’après la réciproque 
du théorème de Desargues, que les trois 
droites portant les couples de sommets 
homologues de T’ et de T” se rencontrent 
en un même point S. On définit ainsi une 
correspondance réciproque point à point 
et droite à droite, la construction du 
transformé M” d’un point courant M’ 
s’obtenant aisément par intersection de 
droites, dès lors que sont donnés le som- 
met de l’involution S, son axe D et deux 
couples de points homologues, A'A", B’B” 
(A’ A” et B’B” étant soumis à la seule 
condition de se rencontrer en S). 

Dans ses travaux sur les coniques, 
Pascal reprend les méthodes et les résultats 
de Desargues, mais de manière beaucoup 
plus synthétique et plus claire. 11 y ajoute 
des éléments nouveaux remarquables dont 
le plus important est le théorème de 
l’hexagone inscrit dans une conique : Les 
trois points de concours des côtés opposés 
d’un hexagone inscrit dans une conique 
sont en ligne droite. Pascal démontre ce 
théorème d’abord pour le cercle et l’étend 
ensuite par une projection aux coniques. 

Il est possible que Pascal ait entrevu le 
théorème dual, démontré par Charles 
Julien Brianchon (1783-1 864) au début du 
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XIX e siècle : On peut toujours trouver trois 
diagonales concourantes dans un hexa- 
gone circonscrit à une conique. 

Pascal devait déduire du théorème de 
l’hexagone de nombreuses propriétés des 
coniques, en particulier les propriétés des 
pôles et polaires, considérant à cet effet le 
cas où, deux points de l’hexagone étant 
confondus, un des côtés se trouve être la 
tangente à la conique en ce point. 

Renouveau et essor 
de la géométrie projective 
C’est seulement à la fin du XVIII e siècle que 
renaît l’intérêt pour la géométrie projec- 
tive. Elle devait alors connaître un essor 
remarquable. Son renouveau est jalonné 
d’une série d’oeuvres majeures : Gaspard 
Monge, Application de V algèbre à la géo- 
métrie (1795), Géométrie descriptive 
(1795) ; Lazare Carnot, Géométrie de posi- 
tion (1803) ; Jean Victor Poncelet, Traité 
des propriétés projectives des figures 
(1822) ; Michel Chasles, Aperçu historique 
sur le développement des méthodes en 
géométrie (1837), Traité de géométrie supé- 
rieure (1852) ; C. Van Staudt, Geometrie 
der Lage (1847). 

Chez Monge, la géométrie analytique et 
la géométrie pure demeurent intimement 
associées. De plus, son intérêt se porte 
surtout sur la géométrie descriptive qui 
représente les figures de l’espace par deux 
projections orthogonales sur deux plans 
perpendiculaires. Monge ne semble pas 
avoir saisi toute l’importance de la projec- 
tion centrale. 11 n’en eut pas moins une 
influence décisive sur le développement 
ultérieur de la géométrie projective, 
notamment par le sens de l’espace qui 
imprègne tout son enseignement. 

Avec Poncelet s’affirme beaucoup plus 
nettement le dessein de constituer la géo- 
métrie projective en discipline autonome. 


Poncelet veut « rendre la géométrie enfin 
indépendante de l’analyse algébrique », et, 
pour lui, les propriétés projectives des 
figures comptant parmi les plus générales 

que l’on connaisse méritent à ce titre seul 
l’attention des géomètres. Il entend faire 
cesser un état de choses où « la géométrie 
analytique offre des moyens généraux et 
uniformes » alors que «jusqu’ici l’autre 
géométrie a procédé par hasard ». Il veut 
« donner aux conceptions géométriques 
cette extension et cette généralité qui sont 
dans sa nature et les constituer en une 

doctrine organique ». Il souligne aussi 

l’avantage qu’offre la géométrie projective 
du fait que ((jamais on n’y tire des 

conséquences sans que les formes réelles et 
existantes ne puissent se peindre à l’image 
et à la vue ». 

La géométrie projective de Poncelet se 
fonde sur deux principes fondamentaux, 
les principes de continuité et de projection. 

Le principe de continuité s’énonce 
ainsi : Chaque fois qu’une démonstration 
a été obtenue en supposant finies et réelles 
certaines parties de la figure qui intervien- 
nent dans la démonstration, la proposition 
subsiste quand ces parties disparaissent ou 
deviennent infinies ou imaginaires ou que 
la démonstration ne subsiste plus. Ainsi, 
l’extension du fini à l’infini réalisée par 
Desargues et Pascal est complétée par 
l’extension aux points imaginaires que 
ceux-ci n’avaient aucunement envisagée. 
Ce principe devait être vivement critiqué, 
particulièrement par Augustin Cauchy. Il 
convenait de préciser, ce qui fut fait plus 
tard, que ce principe vaut seulement lors- 
que les propriétés envisagées se traduisent 
par des relations algébriques, qui étaient 
d’ailleurs les seules que faisait intervenir 
Poncelet. L’application la plus obvie de ce 
principe est offerte par les intersections de 
deux cercles dont l’axe radical, défini par 
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les deux points d’intersection des cercles 
lorsque ceux-ci se coupent, subsiste encore 
lorsqu’ils ne se coupent plus. 

Pour le principe de projection, Poncelet 
retient les propriétés qui se conservent par 
projection centrale et par les transforma- 
tions qui en dérivent, notamment l’homo- 
logie dans le plan définie plus haut ; ces 
propriétés peuvent être réduites par pro- 
jection « à des circonstances plus simples » 
se trouvant alors plus aisément démontra- 
bles. Michel Chasles (1793-1 880) devait 
exprimer ce principe d’une manière plus 
claire et le généraliser : « Que l’on prenne 
une figure quelconque de l’espace et l’une 
de ses propriétés communes, qu’on appli- 
que à l’une de ces figures l’un de ces modes 
de transformations et qu’on suive les 
diverses modifications qu’éprouve le théo- 
rème qui exprime cette propriété, on aura 
une nouvelle figure et une nouvelle pro- 
priété qui correspondra à celle de la 
première. Ce moyen que possède la géo- 
métrie récente permet de multiplier à 
l’infini les propriétés géométriques. » 

La mise en œuvre de ces deux principes 
par Poncelet et, après lui, par plusieurs 
autres géomètres, Chasles en particulier, 
devait permettre une unification et une 
extension remarquables de la géométrie, 
spécialement dans le domaine de la théorie 
des coniques. Poncelet utilisa surtout la 
transformation qualifiée par lui d'homolo- 
gie (définie plus haut), dont le principe 
avait été posé, on l’a vu, par Desargues, 
mais qu’il devait étendre à l’espace. 

Chasles, posant le problème plus large 
de la détermination de la transformation 
ponctuelle la plus générale qui fait corres- 
pondre à une droite une droite et à un plan 
un plan, devait définir la transformation 
qu’il désigna par le terme d’homographie. 
K. G. C. von Staudt (1798-1867) et Gas- 
ton Darboux (1842-19 17) en donnèrent 


plus tard une justification plus rigoureuse. 
Cette transformation se définit analytique- 
ment dans le plan par l’équation : 

, _ ax + by + c 
X dx +ey +f 

et par une équation analogue pour y'. 
L’homologie correspond au cas particulier 
où une droite l’axe d’homologie se 
transforme en elle-même, point par point. 

Il faut en outre mentionner l’introduc- 
tion par Monge de la transformation par 
polaire réciproque, qui, une conique (resp. 
une quadrique) étant donnée, fait corres- 
pondre réciproquement dans le plan un 
point (pôle) à une droite (sa polaire) et, 
dans l’espace, un point pôle à un plan (son 
plan polaire). Cette transformation fut 
systématiquement utilisée, notamment par 
Joseph Diez Gcrgonnc (1771-1 859), 
Brianchon, Poncelet et Chasles, qui devai- 
ent en montrer toute la fécondité. Par là 
était introduite la notion de dualité dont 
l’importance majeure ne tarda pas à être 
soulignée, et qui devait recevoir une exten- 
sion bien au-delà de la géométrie projec- 
tive, par l’introduction, due à Monge, mais 
non développée par lui, de la notion de 
transformation de contact. 

En dépit des vues profondes de Pon- 
celet et de Chasles et des nombreux 
résultats auxquels ils parvinrent, la géomé- 
trie projective souffrait d’un grave défaut : 
la distinction entre propriétés métriques et 
propriétés projectives n’était pas élucidée 
de façon satisfaisante, les propriétés pro- 
jectives demeurant d’ailleurs, le plus sou- 
vent, définies par des considérations et des 
relations de caractère métrique. Cette 
carence devait conduire von Staudt, en 
1847, à une présentation abstraite de la 
géométrie projective où n’intervenaient 
plus les éléments de caractère métrique, 
c’est-à-dire les notions d’angle et de dis- 
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tance. Cette synthèse n’était cependant pas 
tout à fait sans défaut. En particulier, elle 
faisait intervenir inutilement le postulat 
des parallèles. C’est seulement avec les 
travaux de Hilbert, Klein (1849-1925), 
Darboux (1842-1 917) à la fin du XIX e siècle, 
et, plus tard, ceux de Federigo Enriques 
(1871-1946), que seront formulées de 
façon rigoureuse les notions de base et les 
axiomes de la géométrie projective. 

4. Les géométries non euclidiennes 

Jusqu’au début du XVIII e siècle, le problème 
posé par le postulat des parallèles fut 
envisagé dans la même perspective : le 
postulat n’est pas une évidence première, 
mais une vérité qu’on doit pouvoir démon- 
trer. La plupart des démonstrations se 
fondent sur la définition de la parallèle 
comme droite équidistante à une droite 
donnée, définition que l’on ne trouve pas 
dans les Éléments d’Euclide, il faut le 
noter. On ne soupçonne pas le cercle 
vicieux qu’implique une telle façon de 
faire, la possibilité qu’une droite puisse 
être équidistante à une autre droite sup- 
posant le postulat. Telles se présentent les 
démonstrations de Posidonius (II e siècle 
av. J.-C.), de Geminus (I e siècle apr. J.-C.), 
de Proclus (V e siècle apr. J.-C.) ; et encore 
celle du jésuite Clavius (1537-1612) à la fin 
du XVI e siècle, celui-ci doutant cependant 
de la validité de sa démarche. Le jésuite 
G. Saccheri, dans son Eudides ah omni 
naevo vindicaîus (1733), est le premier 
mathématicien à mettre nettement en 
doute la validité des démonstrations fon- 
dées sur Féquidistance et à proposer une 
autre approche, la réduction à l’absurde : 
supposer que le postulat des parallèles ne 
vaut pas et démontrer que cette hypothèse 
aboutit à une contradiction. À cet effet, 


Saccheri fait appel au trapèze isocèle 
qu’avait introduit le géomètre arabe Nasir 
ai-DTn (XIII e siècle). Ce trapèze est construit 
en menant perpendiculairement aux extré- 
mités d’une droite AB deux segments 
égaux AC et AD. Les angles intérieurs en 
C et D sont égaux. Ils valent un droit dans 
le cas où le postulat est vrai ; dans le cas 
contraire, ils sont soit aigus, soit obtus. 
Ainsi, bien avant que ne soit prouvée la 
validité des géométries non euclidiennes, 
était mis en évidence le dédoublement de 
l’hypothèse de la négation du postulat : 
angle aigu (géométrie de Lobatchevski), 
angle obtus (géométrie de Riemann). 
Nàsir al-Din avait très vite cru pouvoir 
conclure que ces angles intérieurs en C et 
D étaient droits, pensant donc avoir 
démontré le postulat. Saccheri arrive à la 
même conclusion, mais au terme de longs 
développements, au cours desquels, contre 
son gré pourrait-on dire, il édifie pour une 
grande part la géométrie de Nikolaï Iva- 
novitch Lobatchevski (1792-1 856) et pour 
une moindre part celle de Bernhard Rie- 
mann (1826-1 866). Finalement, il rejette 
les deux hypothèses de l’angle aigu et de 
l’angle obtus, car elles le conduisent à deux 
conclusions qu’il estime non admissibles, 
la première à l’existence d’une perpendi- 
culaire commune à deux droites à l’infini, 
la seconde à l’affirmation que deux droites 
contiennent un espace. 

Plus de trente ans plus tard, en 1766, le 
mathématicien suisse Johann Heinrich 
Lambert (1728-1 777), indépendamment 

semblet-il de Saccheri, dans une étude qui 
ne sera publiée qu’en 1786, suit fondamen- 
talement la même démarche que Saccheri. 
Mais si, comme ce dernier, il rejette 
l’hypothèse de l’angle obtus, il est plus 
hésitant dans le cas de l’angle aigu. 

Cari Friedrich Gauss (1777-1 855) 
amorce vraiment, autour des années 1820, 
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la rupture avec la croyance bimillénaire en 
la démonstrabilité du postulat des parallè- 
les : Gauss pense que l’on peut démontrer 
de façon rigoureuse que l’hypothèse de 
l’angle obtus conduit à une contradiction, 
mais il arrive à la conviction que l’on ne 
peut pas y parvenir dans le cas de T hypo- 
thèse de l’angle aigu. Cette vue entraîne un 
changement radical dans la conception de 
la géométrie. Gauss déclare que, désor- 
mais, « la géométrie ne doit pas être mise 
au même rang que l’arithmétique dont la 
vérité est purement a priori, mais plutôt au 
même rang que la mécanique », 

Lobatchevski, dont les travaux se 
situent entre 1826 et 1856, parvient en 
1834 à une conclusion encore plus expli- 
cite : « La vérité à établir le postulat des 
parallèles n’est pas impliquée dans les 
notions antérieures ; pour la démontrer, il 
faut recourir à des expériences, par exem- 
ple aux observations astronomiques. » Ces 
expériences furent faites à l’époque et 
montrèrent qu’au degré de précision des 
appareils de mesure on ne pouvait écarter 
la géométrie euclidienne. Le mathémati- 
cien hongrois Farkas Bolyai (1775-1 856 ), 
qui, indépendamment de Lobatchevski. 
élabore de façon assez complète la géo- 
métrie de l’angle aigu dans La Science 
absolue de l'espace (1832), n’a pas une 
attitude aussi nette ; il n’aperçoit pas 
clairement que la validité du postulat des 
parallèles est à chercher non dans une 
déduction logique à partir des axiomes 
d’Euclide, mais dans l’expérience. 

Quant à l’hypothèse de l’angle obtus, en 
1854, elle est reconnue acceptable par 
Riemann, bien qu’elle conduise à affirmer 
que les droites sont de longueur finie et que 
deux droites peuvent enfermer un espace. 

Toutefois, ces vues nouvelles ne firent 
qu’ assez lentement leur chemin. Il restait 
d’ailleurs à s’assurer qu’en poursuivant le 


GÉOMÉTRIE 

développement des deux géométries non 
euclidiennes, on n’y rencontrerait pas de 
contradiction, ce qui ne fut réalisé de façon 
pleinement satisfaisante qu’à la fin du 
XIX e siècle grâce aux travaux de Klein et 
par l’élaboration de modèles des deux 
géométries ; ainsi, pour la géométrie de 
Bolyai-Lobatchevski, par le modèle de 
Henri Poincaré (1854-1 9 12 ), où l’on consi- 
dère le demi-plan et où les droites sont 
représentées par les demi-cercles centrés 
sur la droite qui limite ce demi-plan ; et, 
pour la géométrie de Riemann, par une 
correspondance associant à un point de 
l’espace une droite, et à une droite un plan 
(cf. groupes ™ Groupes classiques et 
géométrie, chap. 3). 

Soit qu’au début ils les rejettent comme 
aboutissant à des contradictions, soit que, 
au contraire, ne parvenant pas à y trouver 
de contradiction, ils inclinent à les recon- 
naître valables, durant un siècle environ, à 
partir de Saccheri jusqu’à Lobatchevski et 
Bolyai, les géomètres ont peu à peu élaboré 
la géométrie de l’angle aigu et, de façon 
beaucoup plus sommaire, celle de l’angle 
obtus qui ne prend vraiment consistance 
qu’ après son acceptation par Riemann. 

Saccheri et Lambert montrent que les 
trois hypothèses, angle aigu, angle droit, 
angle obtus, sont stables, c’est-à-dire que, 
si elles valent pour un trapèze, elles valent 
pour tout trapèze. Ils établissent en outre 
que ces trois hypothèses sont équivalentes 
aux trois catégories de valeurs possibles 
pour la somme des angles d’un triangle : 
inférieure, égale, supérieure à deux droits. 

Dans le cas de l’angle aigu, Saccheri 
montre, ce qu’avait à peine aperçu Lam- 
bert, que, pour un point situé hors d’une 
droite, on peut mener une infinité de 
droites non sécantes. Pour chaque droite 
non sécante, on peut déterminer une 
perpendiculaire commune à cette non- 
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sécante et à la droite. De plus, Saccheri a 
reconnu l’existence de deux droites limites 
qui se rapprochent indéfiniment de la 
droite donnée, l’une à droite, l’autre à 
gauche. 

Allant plus loin que Saccheri, Lambert, 
se fondant sur l’analogie de la géométrie de 
l’angle aigu avec la géométrie sur la sphère, 
pour la valeur de la surface d’un triangle, 
montre, en faisant appel à une sphère 
imaginaire, que, dans la géométrie de 
l’angle aigu, la surface d’un triangle est 
proportionnelle à la différence entre deux 
droits et la somme des angles du triangle. 
Par là, il introduit une constante caracté- 
ristique de l’espace qui séduira Gauss et 
constituera une des raisons principales qui 
inciteront le mathématicien allemand à 
penser que cette géométrie peut être vraie. 
Lambert est conduit à une conclusion 
assez surprenante, mais qui ne le choque 
pas : dans la géométrie de l’angle aigu, 
quand la longueur des trois côtés d’un 
triangle devient infinie, la surface du trian- 
gle n’en demeure pas moins finie. 

Quant à la géométrie de l’angle obtus, 
dont Riemann montre en 1854 qu’elle 
n’est nullement contradictoire, un esprit 
moderne peut s’étonner qu’il ait fallu 
attendre si longtemps avant de l’admettre, 
alors que, dès le milieu du XVIII e siècle, les 
études sur les propriétés infinitésimales des 
surfaces et même, bien avant, la connais- 
sance des triangles sphériques en offraient 
un modèle dans le cas de l’espace à deux 
dimensions, au moins dans le voisinage 
d’un point. Mais une telle manière de voir 
les choses est anachronique : elle implique 
qu’une surface peut être considérée 
comme constituant un espace à deux 
dimensions. C’est là une vue très moderne. 
Encore au XVIII e siècle et même au XIX e , 
une surface ne pouvait aucunement être 
considérée comme constituant un espace ; 


elle n’était qu’une figure de l’espace dont 
on ne concevait pas qu’il pût avoir une 
structure ; on le regardait seulement 
comme un cadre homogène et infini. 

5. Transformations géométriques 

En introduisant la projection centrale, ou 
perspective, en géométrie, Desargues puis 
Pascal avaient ouvert la voie à l’étude des 
transformations géométriques. Ce n’est 
qu’à la fin du XVIII e siècle que les transfor- 
mations géométriques commencèrent vrai- 
ment à retenir l’attention des mathémati- 
ciens. À côté de la projection centrale, 
l’homologie est systématiquement utilisée 
comme transformation par Poncelet ; puis 
Chasles définit l’homographie, transfor- 
mation projective la plus générale. D’autre 
part, des transformations plus particulières 
sont largement étudiées : l’affinité, à 
laquelle s’était déjà intéressé Euler, les 
rotations, les symétries, les translations, les 
homothéties. 

Chez les géomètres purs, les transfor- 
mations apparaissent surtout comme un 
instrument de démonstration, tout spécia- 
lement chez Chasles. Mais les mathémati- 
ciens qui, comme Arthur Cayley (1821- 
1895) notamment, s’intéressent surtout à 
l’analyse et à l’algèbre, s’attachent à leurs 
aspects d’invariance. Ainsi s’amorce entre 
l’algèbre et la géométrie une symbiose 
féconde. 

Ces divers types de recherches tendent 
à donner aux transformations une place 
non plus marginale, mais centrale en 
géométrie, au point que l’on voit au milieu 
du XIX e siècle se dégager l’idée que les 
propriétés géométriques se classent et se 
caractérisent par les transformations qui 
les laissent invariantes. À chaque type de 
transformation correspond une géométrie. 
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Ainsi, en 1868, Hermann von Helmoltz 
développe l’idée que l’on peut caractériser 
les propriétés de l’espace euclidien par les 
propriétés des déplacements, envisagés 
comme transformations ponctuelles. 
D’autre part, la notion de transformation 
allait permettre de préciser les relations 
entre propriétés projectives et propriétés 
métriques (que ni Poncelet, ni Chasles, ni 
même von Staudt n’avaient vraiment élu- 
cidées) et, en outre, entre géométrie eucli- 
dienne et géométrie non euclidienne. Le 
premier pas dans cette voie est fait par 
Cayley, en 1859 : ayant particularisé la 
transformation homographique en lui 
imposant la conservation d’une conique 
dans le plan ou d’une quadrique dans 
l’espace, il peut définir la distance de deux 
points A et B comme le logarithme du 
rapport anharmonique de ces deux points 
et des points de rencontre de la droite qui 
les porte avec la conique ou la quadrique. 
Cette approche allait se révéler très 
féconde. Edmond Laguerre (1834-1 886) 
s’était déjà engagé dans cette voie en 1853 
lorsqu’il avait lié la mesure d’un angle au 
rapport anharmonique de ses côtés et des 
deux droites isotropes passant par le point 
de rencontre de ces côtés. 

Cayley montre alors que l’on peut 
déterminer une conique ou une quadrique 
telle que la distance projective correspon- 
dant à la transformation projective qui la 
conserve est identique à la distance de la 
géométrie euclidienne. La géométrie eucli- 
dienne apparaît comme un type particulier 
de géométrie projective. Enthousiasmé par 
ce résultat, Cayley déclare à la fin de son 
mémoire : « La géométrie projective est 
toute la géométrie. » 

Dans des travaux entrepris à partir de 
1868, Klein reprend ces vues pour les 
préciser et leur donner de plus larges 
applications. Il définit de façon plus rigou- 


reuse la notion de distance cayleyenne ; 
puis, portant son attention aux deux géo- 
métries non euclidiennes, dont ne s’était 
pas occupé Cayley, il montre qu’elles 
viennent aussi prendre place dans le cadre 
de la géométrie projective, en associant à 
chacune des deux géométries non eucli- 
diennes une transformation conservant 
une conique dans l’espace à deux dimen- 
sions, et une quadrique dans l’espace à 
trois dimensions, définies de façon appro- 
priée. Ainsi les trois géométries d’Euclide, 
de Bolyai-Lobatchevski et de Riemann se 
trouvent rapprochées et apparaissent 
comme des types particuliers de géométrie 
projective. 

De plus, posant le problème général de 
la détermination des géométries projecti- 
ves à courbure constante, Klein établit 
qu’il ne peut en exister que trois types qui 
sont précisément les trois géométries. 
Ainsi les géométries non euclidiennes, qui 
étaient considérées jusque-là comme des 
situations géométriques plutôt bizarres, 
aberrantes et sans rapport avec la géomé- 
trie euclidienne et la géométrie projective, 
se révèlent avoir une place précise et 
nécessaire au sein de la géométrie projec- 
tive à côté de la géométrie euclidienne ; 
Klein tient à noter que cette conclusion est 
obtenue par des considérations « tout 
autres » que celles par lesquelles ces géo- 
métries avaient été précédemment défi- 
nies. Ajoutons que, par une telle intégra- 
tion, il était clairement établi que la 
géométrie projective générale ne fait pas 
intervenir le postulat des parallèles, ce que 
ni Poncelet, ni Chasles, ni Staudt n’avaient 
su montrer. 

Transformations et groupes 

Le rôle des transformations, en géométrie, 
ne fut pleinement compris que lorsque 
Klein leur associa la notion de groupe, 
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introduite par Évariste Galois (18 1 1-1 832) 
en 1830, et diffusée seulement en 1870 par 
le Traité des substitutions et des équations 
algébriques de Camille Jordan ( 1838 - 
1922). C’est par cet ouvrage que Klein en 
prit connaissance. Certes, en 1844, Her- 
mann Grassmann (1809-1 877) avait déjà 
pressenti qu’il y aurait lieu de faire inter- 
venir l’algèbre dans l’étude fondamentale 
de la géométrie, mais il ne devait pas 
dépasser dans cette voie des vues généra- 
les. Klein, au contraire, envisage d’emblée 
une « théorie des groupes qui peuvent être 
engendrés par les transformations d’une 
nature donnée ». Il montre alors que la 
plupart des transformations géométriques 
considérées avant lui constituent bien des 
groupes (loi de composition, élément 
inverse, élément unité). Ces groupes sont 
hiérarchisés. Klein appelle groupe princi- 
pal celui qui correspond aux transforma- 
tions qui n’altèrent pas les propriétés 
géométriques des figures. Il est défini par 
l’ensemble des opérations de translation, 
de rotation et de symétrie. En supprimant 
les symétries, on obtient le groupe des 
déplacements euclidiens. Le groupe prin- 
cipal lui-même s’insère dans le groupe des 
similitudes constitué par l’ensemble des 
opérations d’homothéties et de translation. 
Ce groupe prend place à son tour dans le 
groupe affine qui garde le parallélisme et, 
pour une direction donnée, les rapports de 
longueur. On peut le définir comme une 
homographie conservant le plan à l’infini. 
Ainsi, alors que demeuraient auparavant 
nettement distinguées et considérées 
comme de nature différente les opérations 
qui n’altèrent pas les figures, qui préser- 
vent en quelque sorte leur identité, et, à 
l’opposé, des opérations qui les modifient, 
comme l’étaient déjà les symétries et les 
similitudes, mais beaucoup plus encore les 
homologies et les homographies, Klein 


propose, par une mutation de perspective 
dont on ne saurait trop souligner l’audace 
et la portée, de ne plus s’attacher à une telle 
distinction et de réunir toutes ces opéra- 
tions dans un type unique de processus : 
des transformations hiérarchisées consti- 
tuant des groupes. Cette conception sys- 
tématique et unifiée est proposée par lui en 
1872 dans le célèbre programme d’Erlan- 
gen. L’objet de la géométrie se trouve ainsi 
défini : « Etant donné une multiplicité et 
un groupe, étudier les êtres au point de vue 
des propriétés qui ne sont pas altérées par 
les transformations du groupe », ou 
encore : « Etant donné une multiplicité et 
un groupe de transformation, développer 
la théorie des invariants relatifs à ce 
groupe. » Comme le dit encore Klein, « les 
méthodes géométriques modernes sont 
caractérisées par le fait que leurs considé- 
rations, au lieu de s’appuyer sur le groupe 
principal, reposent sur des groupes de 
transformation plus étendus. Dès que leurs 
groupes se contiennent l’un l’autre, une loi 
analogue établit leurs rapports récipro- 
ques. De la sorte, pour la première fois, les 
divers ordres de recherche de la géométrie 
sont exprimés par des groupes de trans- 
formation qui leur correspondent. » 

Cette doctrine unificatrice ne se limitera 
pas aux transformations que l’on avait 
étudiées jusque-là, et dont la plus générale 
était l’homographie. La logique même de 
la démarche de Klein et ses contacts avec 
le mathématicien norvégien Sophus Lie 
(1842-1 899 ), qui venait d’entreprendre ses 
travaux sur les groupes continus, condui- 
saient à envisager des groupes plus géné- 
raux allant jusqu’au groupe le plus général 
des transformations continues auquel cor- 
respondent des propriétés de « position », 
dont plusieurs avaient déjà été reconnues 
et dont l’étude constituera la topologie 
algébrique. 
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6. La généralisation de Riemann 

Si la synthèse de Klein avait pu sembler 
couvrir tout le champ de la géométrie, elle 
ne portait en fait que sur des espaces 
« homogènes ». En 1854, dans sa Disser- 
tation inaugurale , Riemann avait proposé 
une conception plus générale, et, en un 
sens, plus profonde de la géométrie. Il 
s’était attaché au « concept général de 
grandeur de dimension multiple (déjà envi- 
sagé, mais de façon beaucoup moins pré- 
cise, par Grassmann en 1 847 ), compre- 
nant comme cas particulier les grandeurs 
étendues » et il avait conclu qif« une 
grandeur de dimensions multiples est sus- 
ceptible de différents rapports métriques » 
et que « l’espace n’est par suite qu’un cas 
particulier d’une grandeur de trois dimen- 
sions ». Se libérant encore plus nettement 
que Gauss et Lobatchevski de la limitation 
qu’imposait le lien de la géométrie avec 
l’espace physique, et allant au-delà de la 
reconnaissance de la validité de la géomé- 
trie de l’angle obtus, Riemann fut amené 
à définir un espace à partir d’éléments 
différentiels, en exprimant le carré ds 1 de 
l’élément de distance entre deux points 
infiniment voisins en fonction des éléments 
différentiels d.X> dy et dz des coordonnées 
d’un point. Riemann définissait alors un 
type d’espace très général dont l’intérêt 
devait notamment apparaître lors de la 
création par Albert Einstein de la théorie 
de la relativité générale. Les conceptions 
de Klein et de Riemann ne furent « rac- 
cordées » que par les travaux d’Élie Cartan 
( 1869 - 1951 ), qui généralisa la notion 
d’espace de Riemann par l’introduction 
d’une connexion définie par un groupe. 

Déjà avec Klein, mais plus encore avec 
Riemann, la notion de géométrie avait 
connu une mutation profonde, non seule- 
ment par les généralisations qu’ils en 


donnaient, mais aussi par la substitution, 
dans la conception de la géométrie, à 
l’intérêt premier porté aux figures, de la 
considération de la nature même de 
l’espace. Réalité « neutre », sans 
« forme », simple réceptacle dans la géo- 
métrie classique, l’espace, désormais envi- 
sagé comme une structure, était reconnu 
comme le constituant fondamental de la 
géométrie, comme son objet premier. 

FRANÇOIS RUSSO 
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S OUS sa forme actuelle, la géométrie 
algébrique est une branche de l’algèbre 
relativement récente (cf. ALGÈBRE). Pour 
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« comprendre » les phénomènes d’inter- 
section des courbes et des surfaces, il s’est 
révélé nécessaire d’élaborer des techniques 
compliquées qui se sont développées de 
manière abstraite et sont venues à leur tour 
enrichir d’autres domaines des mathéma- 
tiques (théorie moderne des nombres, 
fonctions analytiques de plusieurs varia- 
bles complexes, topologie algébrique) ; 
pour le profane, cet appareil mathémati- 
que peut sembler bien loin de l’« intuition 
géométrique » ! 

La géométrie algébrique est issue de 
l’étude des courbes algébriques du plan R 2 
ou de l’espace R 3 et des surfaces algébri- 
ques de R 3 . Pendant le XVIII e et le XIX e siè- 
cle, on s’est aperçu qu’il était plus com- 
mode de modifier le problème en se 
plaçant dans le plan complexe C 2 ou dans 
l’espace complexe C 3 ; en effet, C est un 
corps algébriquement clos, de sorte que les 
courbes et les surfaces ont toujours « suf- 
fisamment » de points à coordonnées com- 
plexes, alors qu’il peut n’y avoir aucun 
point à coordonnées réelles (comme c’est 
le cas pour la courbe d’équation 
* 2 + L 2 +■ 1 = 0). On a observé aussi que 
certains énoncés intéressants n’étaient 
vrais que si l’on complétait les courbes et 
les surfaces par des « points à l’infini », se 
plaçant ainsi dans le plan projectif P?(C) 
ou dans l’espace projectif P 3 (C) ; les cour- 
bes ou les surfaces y sont définies par des 
équations polynomiales homogènes por- 
tant sur les coordonnées homogènes. 

Cette diversité de points de vue (réel ou 
complexe, affine ou projectif) a dû être 
encore élargie lorsque la théorie des nom- 
bres a mis en évidence l’intérêt de l’étude 
des courbes algébriques définies sur des 
corps autres que R ou C, comme les corps 
finis ou les corps p-adiques ; la théorie des 
équations diophantiennes conduit même à 
considérer des courbes ou des ensembles 


algébriques définis sur un anneau tel que 
Z. Pendant la première moitié du XX e siè- 
cle, l’école allemande a développé la théo- 
rie des ensembles algébriques (de dimen- 
sion quelconque) de l’espace affine k n ou 
de l’espace projectif P,(k), k étant un corps 
de base algébriquement clos arbitraire. 

Pour l’étude des propriétés intrinsèques 
d’un ensemble algébrique, il est plutôt 
gênant d’avoir à le considérer comme 
plongé dans un espace affine ou un espace 
projectif. Le problème se pose donc de 
définir des « variétés algébriques abstrai- 
tes », non plongées dans k n ou P,(k), un 
peu comme on définit des variétés diffé- 
rentiables indépendamment d’un plonge- 
ment dans R tt en géométrie différentielle. 
De telles variétés abstraites ont été définies 
par A. Weil (1946). Une définition équi- 
valente, plus simple et plus maniable se 
trouve dans l’article de J. -P. Serre, « Fais- 
ceaux algébriques cohérents » (1955) ; elle 
est inspirée de la théorie des espaces 
analytiques. Dans le présent article, nous 
donnerons la définition de Serre un peu 
élargie, en prenant comme corps de base 
un corps algébriquement clos. Le cas d’un 
corps de base non algébriquement clos, ou 
d’une base plus générale, s’exprime bien 
dans le cadre de la théorie des schémas de 
A. Grothendieck, qui généralise considé- 
rablement celle des variétés algébriques au 
sens de Serre en partant du même point de 
vue. 

fa 

1. Ensembles algébriques 

Soit k un corps de base algébriquement 
clos. Pour tout entier naturel n , l’espace 
affine k n est l’ensemble des suites (jfj, x 2 , . . . . 
X„) de n éléments de k ; on appelle ces n 
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éléments les coordonnées du points = (Xj, 
X 2 , .... x,,) de k”. L’espace projectif P,(k) 
est le quotient de k n ^ ] {0}, complémen- 
taire de l’origine 0 = (0, 0, ... . 0), par la 
relation d’équivalence qui identifie (x 0 , 
Xj, • • • • X n ) à toute suite proportionnelle (/x 0 , 
txi, • • • • tx n ) (t élément non nul de k) ; on 
voit que les points P n (k) sont les droites 
passant par 0 dans k n + *, privées de 0. Si 
un élément (Xq, Xj . . . . x,) de k n + 1 repré- 
sente un point x de P,(k), on dit que les 
coordonnées Xo, Xj, . . . . X n de cet élément 
sont des coordonnées homugénes de x ; elles 
ne sont pas toutes milles et sont définies à 
un facteur de proportionnalité près. 

Une partie X de k n est un ensemble 
algébrique affine si c’est l’ensemble des 
zéros communs à des polynômes 
/ 2 , . .., t f s par rapport aux coordonnées ; on 
dit que X est défini par les équations : 

••>*«)= 0 

fi{x u x 2 x„) = 0 

/,(* i,x 2 x,) = 0. 

Un ensemble ulgébrique projectif dans 
P,(k) est défini d’une manière analogue 
par des équations polynomiales homogè- 
nes par rapport aux coordonnées homo- 
gènes. 

Applications régulières 

Soient XC k m et Y C k n des ensembles 
algébriques affines ; une application u de X 
dans Y est dite régulière si les coordonnées 
U |(x), w 2 (x ), ..., u,(x) de u(x) sont des fonc- 
tions polynomiales des coordonnées du 
point x de X. En particulier, les applications 
régulières de X dans k, encore appelées 
fonctions régulières sur X, sont les fonctions 
polynomiales des coordonnées d’un point 
de X ; elles forment un sous-anneau de 
l’anneau de toutes les applications de X 
dans k. et ce sous-anneau est visiblement 


isomorphe au quotient de l’anneau des 
polynômes A:[T i , T 2 , . . . . T,] par l’idéal des 
polynômes qui s’annulent sur X. 

Il est clair que la composée de deux 
applications régulières est une application 
régulière. En particulier, une application 
régulière u : X — * Y définit un homomor- 
phisme f " f o w, de l’anneau des fonc- 
tions régulières sur Y dans l’anneau des 
fonctions régulières sur X. Un isomor- 
phisme d’un ensemble algébrique X sur un 
autre Y est une application bijective de X 
sur Y, qui est régulière ainsi que sa 
réciproque ; il définit un isomorphisme de 
l’anneau des fonctions régulières sur Y sur 
l’anneau des fonctions régulières sur X. 

On trouvera ci-après quelques exemples 
d’applications régulières. 

Paramétrisation d’une parabole (fig. 1). 
Considérons l’application U de la droite k 

1 fig. 1 I 


y 



isomorphisme d’une droite et d’une parabole 


dans le plan k 2 définie par u(t) = (/, t 1 ). 
L’image u(k) est la parabole X d’équation 
y = x 2 , et u définit une bijection de k sur 
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X, réciproque de l’application (x, j?) h-» j ; 
on a donc un isomorphisme de la droite k 
sur la parabole X. 

- Cissoïde (fig. 2). L’application y; t (/ 2 , 



t 3 ) de k dans k 2 est aussi une application 
régulière. Elle applique la droite k bij acti- 
vement sur son image, qui est la « parabole 
semi-cubique » (ou cissoïde) Y d’équation 
y 1 = x 3 ; mais ce n’est pas un isomor- 
phisme de k sur Y, car la bijection réci- 
proque v', définie par /(jt, y) = v/x si 
X 0 et y'(0, 0) = 0 n’est pas une appli- 
cation régulière. En fait on peut montrer 
que la cissoïde Y n’est pas isomorphe à une 
droite en observant que son anneau de 
fonctions régulières n’est pas intégrale- 
ment clos (la fraction ~ = yjx vérifie 
l’équation z 2 = .y, donc est entière sur cet 
anneau, sans y appartenir, cf. ANNEAUX 
commutatifs), et ne peut par suite être 
isomorphe à l’anneau k[T] des fonctions 
régulières sur k. 

- Paraboioïde (fig. 3). L’application ration- 
nelle (x, y) ► (x, y, jçy) du plan k 2 dans 



l’espace k 3 définit un isomorphisme du plan 
sur le paraboioïde d’équation z — xy. 

Pour définir les applications régulières 
d’un ensemble algébrique projectif 
X C P,„(/:) dans un autre Y C P n (k), on 
procède de la même façon. Une applica- 
tion u de X dans Y est régulière si les 
coordonnées homogènes de u(x) peuvent 
s’exprimer par des polynômes homogènes 
Ufr w,, u /v tous de même degré par 
rapport aux coordonnées homogènes de 
X ; notons que ces polynômes ne peuvent 
s’annuler simultanément pour x G X. Si 
maintenant X C k m est affine et Y C P,(k) 
est projectif, les applications régulières de 
X dans Y sont définies en donnant les 
coordonnées homogènes sur Y comme 
fonctions polynomiales (ne s’annulant pas 
simultanément) des coordonnées sur X ; 
quant aux applications régulières de Y 
dans X, ce sont les applications constantes 
(les polynômes homogènes de degré 0 sont 
les seuls à être constants sur chaque droite 
issue de l’origine dans k n ~ i_1 ). 
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Par exemple, l’application a,, de k n dans 
P„(k) qui transforme (x t , X 2 , .... x,) en le 
point de coordonnées homogènes 
(1, A'i, . . . . X n ) est régulière ; elle définit une 
bijection de k n sur le complémentaire de 
I’hyperplan d’équation homogène x 0 = 0 
dans P,(k) (fig. 4). Tout ensemble algébri- 

I fig. 4 I 


b) 


Plongement <> 2 du plan affine dans le plan projectif 

que X de k n s’identifie par a n à la partie 
d’un ensemble algébrique X de P,(k) où 
x 0 ¥=■ 0 ; si les équations de X sont : 

/, = o...../,= o 

les équations homogènes de X sont : 

• ” x */x o) = 0, 

- x of s (xi/x o, •••• X„/x o ) = 0 

(dj désigne le degré f) ; nous dirons que 
X est la complétion projective de X. Toute 
application régulière u d’un ensemble algé- 
brique affine X dans un autre Y se pro- 
longe d’une manière unique en une appli- 
cation régulière ü de X dans Y. En 
particulier, l’application u '• t (t, t 2 ) de k 
dans k 2 se prolonge en l’application régu- 
hère ü : P,(k) !— ► P, (k), qui transforme le 
point de coordonnées homogènes (x, y) en 


le point de coordonnées homogènes (x 2 , 
XV, y 2 ) ; cette application définit un iso- 
morphisme de la droite projective P,(k) 
sur la conique X complétée de la parabole 
X (cf. exemple ci-dessus), dont l’équation 
homogène est y 2 = xz. 

On peut généraliser l’exemple précé- 
dent et l’on peut ainsi définir pour tout 
couple ( n , d) d’entiers naturels une appli- 
cation régulière de P,(k) dans P,(k) dans 
laquelle e = (n -|- \)(n + 2)... (n + d)j 
d ! — 1, de manière à obtenir un isomor- 
phisme de P,(k) sur un ensemble algébri- 
que W n(i dans P,(k) (la variété de 
Yeronese) ; les coordonnées homogènes 
du transformé de x sont tous les monômes 
de degré d par rapport aux coordonnées 
homogènes de x. 

Applications rationnelles 

En remplaçant les polynômes par des frac- 
tions rationnelles dans tout ce qui précède, 
on obtient des « applications » non partout 
définies en général (car les dénominateurs 
peuvent s’annuler ; il y a donc un abus de 
langage à parler d’applications) ; ce sont les 
applications rationnelles. Nous ne donnons 
de définition précise que dans le cas des 
fonctions rationnelles (applications ration- 
nelles à valeur dans k). Considérons 
d’abord un ensemble algébrique affine X 
dans k n ; une fonction rationnellefsur X est 
définie par une fraction P/Q (E A:(T j , 
T 2 , . . . . T„), dont le dénominateur ne 
s’annule pas identiquement sur X ; c’est 
l’application x P(x)/Q(x) de l’ensemble 
U = {xE X| Q(x) 0} dans k. De 
même, pour définir une fonction ration- 
nelle sur un ensemble algébrique projectif 
XC P„(k) on prend une fraction P/Q en 
coordonnées homogènes, avec P et Q 
homogènes de même degré (pour avoir une 
fonction constante sur les droites issues de 
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0 dans Àr /,+ 1 ) et Q non identiquement nul 
sur X. 

La composée de deux applications 
rationnelles f de X dans Y et g de Y dans 
Z peut se définir si l’ensemble des points 
X de X tels quefsoit définie en x et g en 
f(x) n’est contenu dans aucun ensemble 
algébrique strictement plus petit que X ; 
c’est encore une application rationnelle. 
Une équivalence kirationnelle entre X et Y 
est un couple (u, v) où u est une application 
rationnelle de X dans Y et y une applica- 
tion rationnelle de Y dans X, les composés 
y o U et u o V étant les applications identi- 
ques de X et Y respectivement. 

Par exemple (x, y) yjx est une fonc- 
tion rationnelle dans le plan /c 2 , définie 
dans le complémentaire de la droite 
d’équation x — 0. Sa restriction à la 
courbe d’équation y 2 = a ' 3 est une fonction 
rationnelle définie en dehors de l’origine ; 
on voit que la cissoïde est birationnelle- 
ment équivalente à la droite (sans lui être 
isomorphe ; cf. exemple supra et fig. 2). 
D’une manière générale, on dit qu’une 
courbe algébrique est unicursale si elle est 
birdtionnellement équivalente à la droite k 
(Cf. COURBES ALGÉBRIQUES). Les fractions 
A'i/Xq, x 2 /x 0 , .... xjx 0 définissent une appli- 
cation rationnelle de P n (k) dans k n ; cette 
application est définie dans le complémen- 
taire de l’hyperplan d’équation homogène 
A ' 0 = 0 et donne (avec a„ ; cf. supra ) une 
équivalence birationnelle entre P n (k) et k n . 
De même, tout ensemble algébrique affine 
est birationnellement équivalent à sa com- 
plétion projective. 

2, Variétés algébriques affines 

A tout ensemble algébrique affine X C k m , 
nous avons associé la k-algèbre A(X) des 
fonctions régulières sur X ; elle est isomor- 


phe (d’une manière canonique) au quo- 
tient fc[Tj, T 2 , .... T m ]/I(X) où I(X) désigne 
l’idéal formé des polynômes qui s’annulent 
sur X. Si une application u : X — ► Y d’un 
ensemble algébrique dans un autre est 
régulière, f o U appartient à A(X) pour 
toute fonction f de A(Y). Inversement, 
cette condition implique que u est régu- 
hère ; remplaçons en effet f par les fonc- 
tions coordonnées jq, y 2 , y n de Y : nous 
obtenons des fonctions u , = 

o U (i — 1,2, ..., n) régulières sur X, 
c’est-à-dire induites par des polynômes en 
les coordonnées de X. 

On voit même que tout homomor- 
phisme cp de A(Y) dans A(X) détermine une 
application régulière U de X dans Y telle que 
(p soit l’application f t— > ► f o U ; les coordon- 
nées de U sont les fonctions 
<p(V,)> «PW» • • • ^CU/) de A ( x )- Considé- 
rons, en particulier, le cas où X = { e } est 
réduit à un point ; c’est l’espace affine k° et 
son algèbre de fonctions régulières se réduit 
aux constantes A(X) = k. La donnée d’une 
application (régulière automatiquement) 
U : x = {e} — ► Y, c’est-à-dire d’un point y 
= u(e) de Y, équivaut donc à celle de 
l’ homomorphisme f >— ► f o U = f(y) de 

A(Y) dans k ; d’où une bijection de l’ensem- 
ble Y sur l’ensemble Horn, (A(Y), k) des 
homomorphismes de A(Y) dans k. 

Tout isomorphisme A(Y) — ► A(X), où 
X et Y sont des ensembles algébriques 
affines, détermine un isomorphisme de X 
sur Y. Cela nous met sur la voie d’une 
définition intrinsèque des ensembles algé- 
briques affines, indépendamment du plon- 
gement dans un espace k n : la structure 
d’ensemble algébrique est définie par la 
donnée de l’algèbre des fonctions réguliè- 
res. Nous allons considérer une structure 
un peu plus fine, en utilisant une autre 
algèbre qui n’est pas une algèbre de 
fonctions. En effet, il est avantageux de 
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pouvoir distinguer, par exemple, l’ensem- 
ble algébrique {0} C k défini par l’équa- 
tion .v = 0 (« point simple ») du même 
ensemble défini par l’équation x 2 — 0 
(« point double »), bien que ces ensembles 
soient isomorphes. Pour cela, on est 
conduit à associer à l’ensemble algébrique 
X C k ", défini par les équations fi = 0, 
/ 2 =0, f = 0, non pas l’algèbre de 
fonctions k[ Tj, T 2 , . . . . TJ/I(X), mais l’algè- 
bre k[ Tj, T 2 , . . . . T„]/a, où a est l’idéal de 
polynômes engendré par fi,fi, . . .,/ s ; il est 
clair que a est contenu dans I(X), donc 
l’algèbre des fonctions régulières sur X 
s’identifie à un quotient de la nouvelle 
algèbre ; ainsi, tout élément de cette nou- 
velle algèbre définit une fonction régulière 
/ sur X (sa classe modulo I(X)/fl), mais / 
peut être nulle sans que l’élément consi- 
déré le soit Dans l’exemple de (0) C k, 
l’algèbre associée est /c[T]/(T) ~ k dans le 
cas du point simple, d’équation x = 0, et 
/c[T]/(T 2 ) ~ k - f- ÀX, algèbre des nombres 
duaux (extension quadratique de k engen- 
drée par un élément £ de carré nul) dans 
le cas du point double, d’équation x 2 = 0 ; 
l’élément 6 définit une fonction nulle. 

Nous appellerons variété algébrique 
affine un triplet (X, A, cp ) où X est un 
ensemble, A une k-algèbre engendrée par 
un nombre fini d’éléments et cp une bijec- 
tion de X sur Hom^(A, k). Notons que si 
(jVj, x 2 , . • • • x,) est un système de généra- 
teurs de A, il détermine un homomor- 
phisme surjectif k[ T b T 2 . . . . T,] — * A dont 
le noyau a est engendré par un nombre fini 
de polynômes, car l’anneau des polynômes 
est noethérien (théorème de Hilbert, cf. 
ANNEAUX COMMUTATIFS) ; ainsi A est iso- 
morphe à l’algèbre associée à un ensemble 
algébrique affine contenue dans k* 1 , et cp 
détermine une bijection de X sur cet 
ensemble. Un morphisme (X, A, cp ) — ► (Y, 
B, Ip) de variétés algébriques affines est un 


couple (w, v) d’une application u : X Y 
et d’un homomorphisme v : B — ► A de 
k-algèbres, tel que Cp(x) o v = ip(w(x)) pour 
tout point X de X ; en fait la connaissance 
de v détermine entièrement u (à l’aide de 
Cp et lp). Le composé d’un tel morphisme 
avec un morphisme (il’, v’) : (Y, B, 
lp) — ► (Z, C, x) est le morphisme ( u ' o w, 
V o v’) de (X, A, cp) dans (Z, C, x)- Le 
morphisme (w, v) est un isomorphisme s’il 
existe un morphisme (u, v’) de (Y, B, lp) 
dans (X, A, cp) tel que les composés 
(u, v) o (w, v) et ( u , v) o (u\ v’) soient les 
morphismes identiques (id„ id,) et (id„ 
idg) ; cela revient à dire que v est un 
isomorphisme de k-algèbres. 

La droite affine est la variété (k, k[T], v) 
où ip applique tout élément a de k sur 
l’ homomorphisme k[T] — ► k qui trans- 
forme T en a. Un morphisme de (X, A, cp) 
dans la droite affine est donc formé d’une 
application u de X dans k et d’un homo- 
morphisme v de k[T] dans A ; la donnée de 
v, qui équivaut à celle du morphisme (w, v), 
revient à celle de l’élément f ~ v(T) de A ; 
pour tout point x de X on a 
u(x) = <p (x)(f). Autrement dit, les élé- 
ments de A correspondent bijectivement 
aux morphismes de (X, A, cp) dans la droite 
affine (et non plus aux fonctions réguliè- 
res ; un morphisme est une donnée plus 
riche que la fonction U sous-jacente). 

Nos définitions montrent que l’étude 
des variétés algébriques affines est équiva- 
lente à celle des k-algèbres de type fini 
(c’est-à-dire engendrées par un nombre fini 
d’éléments). Les principaux résultats de 
cette théorie sont dus aux géomètres alle- 
mands de la première moitié du XX e siècle. 
Nous les citerons sans donner de démons- 
tration complète. 

Précisons d’abord que si B est un 
anneau, une B -algèbre A est dite de type fini 
si elle est engendrée en tant qu’ algèbre par 
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un nombre fini d’éléments, tout élément de 
A s’exprimant comme fonction polynôme 
de ces générateurs. L’algèbre A est dit Q finie 
si elle est engendrée par un nombre fini 
d’éléments en tant que B -module : tout 
élément de A est combinaison linéaire des 
générateurs ; cela revient à dire que A est de 
type fini et entière sur B. 

Lemme de normolisation 

d'Emmi Noether 

Soit A une k-algèbre de type fini non nulle, 
engendrée par n éléments. Il existe un 
entier d et un homomorphisme injectif 
v : k[ Tj, T 2 , . . . . TJ — *■ A, faisant de A une 
k[ Tj, T 2 ,. . . . TJ-algèbre finie. 

Géométriquement, v s’interprète 
comme un morphisme de la variété affine 
X qui correspond à A dans l’espace affine 
h 1 ; les propriétés de v impliquent que ce 
morphisme est surjectif et « fini », c’est-à- 
dire qu’il fait de X une sorte de revêtement 
ramifié de k d . 

On peut démontrer ce lemme par récur- 
rence sur le nombre n de générateurs de 
A = k[ T„ T 2 , T„]/a ; il est évident si 

a = {0}, en particulier si n = 0. Dans le 
cas contraire, on montre qu’il est possible 
de trouver un nouveau système de n 
générateurs dont le dernier est entier sur la 
sous-algèbre A’ engendrée par les n - 1 
premiers, de sorte que A est une A’ -algèbre 
finie ; on applique alors l’hypothèse de 
récurrence à A’. 

Par exemple, si A = k[x, y]/(f ) est 
l’algèbre de la courbe plane définie par 
l’équation f(x , y) = 0 , on fait un change- 
ment de base dans k 2 de manière que l’axe 
des y ne soit pas une « direction asymp- 
totique » de la courbe (c’est possible, car k 
est infini) ; l’équation de la courbe prend 
alors la forme : 

Y’ + fli (x)y r -' + + a , (x) = 0, 


où les a, (s) sont des polynômes en x. Ainsi 
la classe de y dans A est entière sur k[x], 
et la courbe apparaît comme un revête- 
ment ramifié (de degré r) de l’axe des A'. 

Appliquons ce résultat en remplaçant A 
par le quotient A/ttl où Ht est un idéal 
maximal de A ; ce quotient est encore de 
type fini sur k, et c’est un corps. D’après 
le lemme, il contient une sous -algèbre B 
isomorphe à une algèbre de polynômes, 
sur laquelle il est une algèbre finie ; on en 
déduit aisément que B est elle-même un 
corps, et ensuite que B ~ k. Comme k est 
algébriquement clos, son extension finie 
A/m lui est isomorphe. Cela prouve que 
tout idéal maximal de A est le noyau d’un 
homomorphisme de A dans k, et permet 
d’établir une correspondance bijective 
entre les idéaux maximaux de A et les 
points de la variété algébrique affine asso- 
ciée à A. Pour développer la géométrie 
algébrique sur un corps non algébrique- 
ment clos, il est raisonnable de remplacer 
l’ensemble HomJA, k) par l’ensemble des 
idéaux maximaux de A dans la définition 
des variétés algébriques affines ; cela 
revient à considérer, outre les « points 
rationnels sur k » de la variété, qui cor- 
respondent à des idéaux maximaux lit tels 
que A/m en k, d’autres points correspon- 
dant a des idéaux maximaux m tels que A/m 
soit une extension finie de k. Nous conser- 
vons un corps de base algébriquement clos 
pour rester plus près des notions intuitives. 

Considérons une variété algébrique 
affine (X, A, cp) ; si f El A et x G X, nous 
noterons /(.r) la valeur en x de la fonction 
sur X définie par fi c’est-à-dire (p (a*) (/ )• 
Pour qu’un élément de / de A soit inver- 
sible, il faut et il suffit que f (a*) # 0 pour 
tout point A' de X ; en effet, cette condition 
signifie que f n’appartient à aucun idéal 
maximal de A, et, d’après le théorème de 
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Krull, un élément non inversible appar- 
tient toujours à un idéal maximal. 

Théorème des zéros de Hilbert 

Soit (X, A, cp) une variété algébrique affine. 
Si /GA les conditions suivantes sont 
équivalentes : 

(1) Pour tout point X de X, f(x) = 0. 

(2) L’élément 1 — / T est inversible 

dans l’algèbre de polynômes A[T] 

(3) fest nilpotent, c’est-à-dire que l’une 
de ses puissances est nulle. 

La condition (2) sert d’intermédiaire 
entre (1) et (3) ; elle s’interprète en disant 
que i -/r ne s’annule pas sur la variété 
affine d’algèbre A[T] (qui n’est autre que 
X X k, cf. infra). Ainsi, on voit aisément 
que ( 1 ) implique (2). Pour voir que (2) impli- 
que (3), on note que 1 —fY admet pour 
inverse 1 + /T f 2 T 2 + . ../"T" 

dans l’algèbre de séries formelles A [[T]], 
si cet inverse est un polynôme, fest nilpo- 
tent. Enfin, si f est supposé nilpotent, il 
en est de même de / (x) pour tout point x ; 
or/ (x) G k , et dans un corps tout élément 
nilpotent est nul. 

Autrement dit, l’ensemble n des élé- 
ments nilpotents de A est l’intersection des 
idéaux maximaux (c’est un idéal qu’on 
appelle le nilradical de A). Pour un anneau 
quelconque, le même raisonnement 
prouve que le nilradical est l’intersection 
des idéaux premiers ; ici, on voit, en 
appliquant le théorème précédent à A/p où 
p est un idéal premier de A, que tout idéal 
premier de A est une intersection d’idéaux 
maximaux (on dit que A est un anneau de 
Jacobson). 

À tout idéal a de A, nous associerons 
l’ensemble V(a) C X des points x tels que 
f(x) = 0 pour tout /G a ; il suffit d’écrire 
cette condition pour un système de géné- 
rateurs (/*], f 2’ • • • • f s ) de a > et on P eut dire 
que V(a) est un sous-ensemble algébrique 


de X. Avec l’algèbre A/a, il forme une 
variété algébrique affine à laquelle on peut 
appliquer le théorème précédent. On 
trouve ainsi que l’idéal I(V (a)) formé des 
élémentsfde A tels que f (x) = 0 pour tout 
x G V(a) est égal à la racine ta(a) de a 
c’est-à-dire à l’ensemble des éléments de A 
qui ont une puissance dans a ; en particu- 
lier, V(a) n’est pas vide si a ^ A (c’est 
l’énoncé du Nullstellensaîz de Hilbert). 

3. Variétés algébriques 

L’utilisation des fonctions régulières ne 
conduit à rien dans l’étude des ensembles 
algébriques projectifs, puisque l’anneau 
des fonctions régulières d’un tel ensemble 
est toujours réduit à k. On peut remplacer 
les fonctions régulières par les fonctions 
rationnelles. La théorie ainsi construite 
permet l’étude des propriétés conservées 
par une équivalence birationnelle ; elle a 
été développée à la fin du siècle dernier, 
principalement en Italie. Cette méthode 
interdit la distinction entre des ensembles 
algébriques birationnellement équivalents, 
même non isomorphes. Il faut donc cher- 
cher dans une autre direction pour obtenir 
une définition intrinsèque des variétés 
algébriques. 

En localisant la notion de fonction 
régulière, on arrive à une notion adéquate. 
Commençons par munir les ensembles 
algébriques d’une topologie qui permette 
une telle localisation. 

Topologie de Zariski 

Si le corps de base est celui des nombres 
complexes, on peut essayer la topologie 
induite par celle de Q n ou P„(C) (c’est la 
topologie transcendante , définie à partir du 
module d’un nombre complexe). Il est 
clair, en effet, que les applications réguliè- 
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res sont continues pour cette topologie ; 
par suite, les isomorphismes la conservent. 
Mais cela ne convient pas au cas d’un 
corps de base général. 

On veut une topologie adaptée à l’étude 
des propriétés algébriques ; ainsi les pro- 
priétés algébriques (ou du moins beaucoup 
d’entre elles) doivent avoir une nature 
locale pour la topologie cherchée : par 
exemple, une fonction rationnelle définie 
en un point doit rester définie au voisinage 
de ce point. Or les ensembles exceptionnels 
où les propriétés algébriques considérées 
cessent d’être vraies sont définis par des 
équations polynomiales (l’annulation du 
dénominateur dans le cas de la définition 
d’une fonction rationnelle) ; ce sont CUX- 
mêmes des ensembles algébriques. Ainsi, 
nous imposons la condition suivante : les 
ensembles algébriques doivent être fermés 
pour la topologie cherchée. Il se trouve qu’il 
existe sur k ” , ou sur P"(/c), une topologie 
bien déterminée pour laquelle les ensem- 
bles fermés sont les ensembles algébriques : 
on l’appelle la topologie de Zariski. 

En effet, l’intersection d’une fa mill e 
(E j)jçzi d’ensembles algébriques est encore 
algébrique : si E, est défini par les équa- 
tions / = 0, À E A„ cette intersection est 
définie par l’annulation de tous les poly- 
nômes f : c’est l’ensemble des zéros 
communs’ aux polynômes de l’idéal engen- 
dré par les et il suffit de prendre un 
ensemble fini de générateurs de cet idéal 
pour avoir un système d’équations de 
l’intersection (rappelons la propriété 
noethérienne de l’anneau des polynômes ; 
dans le cas projectif, il faut bien sûr 
prendre des générateurs homogènes). 
Considérons maintenant la réunion de 
deux ensembles algébriques, définis res- 
pectivement par les équations f j = 0, 

f 2 = °> • fr = 0 et £l = °> Sl = °> 
g s — 0 ; c’est l’ensemble des zéros 


communs aux polynômes fgj (1 ^ i ^ r, 

1 ^ y s), donc un ensemble algébrique. 
Enfin l’ensemble vide est algébrique, étant 
défini par l’équation 1 = 0. Ainsi les 
axiomes des fermés d’une topologie sont 
vérifiés par les ensembles algébriques (cf. 
topologie GÉNÉRALE). Dorénavant nous 
considérons k n et P„(k) comme munis de 
leurs topologies de Zariski, et tout ensem- 
ble algébrique affine ou projectif est muni 
de la topologie induite ; toute variété 
algébrique affine est de même munie de sa 
topologie de Zariski. 

Si (X, A, (p) est une variété algébrique 
affine, une base d’ouverts de sa topologie 
de Zariski est formée des ensembles 
D(/’)=(.yEX f (x) ^ 0},OÙ/E A. On 
obtient de même une base d’ouverts sur un 
ensemble algébrique projectif en considé- 
rant les ensembles où ne s’annule pas un 
polynôme homogène. 

Il est clair que les applications réguliè- 
res sont continues pour la topologie de 
Zariski : l’image réciproque d’un ensemble 
algébrique par une telle application est 
encore algébrique. Ainsi, deux ensembles 
algébriques isomorphes sont hoiïléomor- 
phes. La réciproque n’est pas vraie, puis- 
que la représentation paramétrique 
t >— 1 ► (/ 2 , t 3 ) de la cissoïde est un homéo- 
morphisme de k sur cette courbe, qui n’est 
pourtant pas isomorphe à une droite 
(cf. chap. 1, Applications régulières) ; autre- 
ment dit, la topologie de Zariski est 
insuffisante pour caractériser les ensem- 
bles algébriques à isomorphisme près. 

Anneaux locaux 

À tout point x d’un ensemble algébrique X 
on peut associer l’anneau O x v , des germes 
de fonctions rationnelles sur X définies en 
x ; un tel germe est une classe d’équiva- 
lence de fonctions rationnelles définies en 
x, pour la relation qui consiste à confondre 
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deux fonctions lorsqu’elles coïncident dans 
un voisinage de x. Ainsi un élément de (9 X Y 
est représenté par une fraction P/Q dont le 
dénominateur Q ne s’annule pas en x ; 
dans le cas projectif, les polynômes P et Q 
sont homogènes de même degré. Pour 
qu’un tel élément soit inversible, il faut et 
il suffit que son numérateur P ne s’annule 
pas en x; autrement dit, l’ensemble des 
éléments non inversibles de 0 X v est l’idéal 
m v , noyau de l’homomorphismef-f(x) à 
valeurs dans k, et c’est le seul idéal 
maximal de l’anneau. Un anneau qui 
possède un seul idéal maximal est dit local ; 
nous avons muni l’ensemble algébrique X 
d’un anneau local 0 X v pour chaque 
point x. 

Si une application rationnelle u '• X — > Y 
est définie en un point x de l’ensemble 
algébrique X, il lui correspond un homo- 
morphisme g 1 * g o K de l’anneau local 
é>Y,w(.*) dans l9 x Y ; cet homomorphisme 
applique l’idéal maximal du premier 
anneau dans celui du second, ce qu’on 
exprime en disant que c’est un homomor- 
phisme local. Si ( U , v) est une équivalence 
birationnelle entre X et Y, elle définit une 
bijection entre des ouverts de Zariski par- 
tout denses U et V de X et Y de manière que 
les anneaux locaux en des points corres- 
pondants de U et V soient isomorphes ; 
cela s’applique en particulier à un isomor- 
phisme de X sur Y, avec U = X et V = Y. 

On peut donner trois exemples : 

- Les fonctions rationnelles sur la droite k 
forment le corps k(x) (corps des fractions 
de l’anneau des polynômes k[x]). Comme 
les voisinages ouverts au sens de Zariski 
d’un point (l sont des complémentaires 
d’ensembles finis, deux fonctions ration- 
nelles qui coïncident au voisinage de a sont 
identiques, et l’anneau local de a n’est 
autre que l’ensemble des fractions dont le 
dénominateur n’est pas nul en a. 


- Il est facile de voir que les fonctions 
rationnelles sur la courbe d’équation 
y 2 - X 3 s’écrivent d’une manière unique 
sous la forme R(x) + y S (x), où R et S sont 
des éléments de k(x) ; ainsi l’ensemble des 
fonctions rationnelles sur la cis soïde est un 
corps, extension quadratique de k(x) 
engendrée par un élément y qui vérifie 
y 2 = X 3 . L’anneau local d’un point (a, b) 
s’identifie à l’ensemble des éléments 
R(x) + y S(x) tels que R et S soient 
définies en a. Comme les applications 
U : (t 2 , t 3 ) (application régulière) et 

v = y/x (application rationnelle définie 
sauf en (0, 0)) forment une équivalence 
birationnelle entre la droite et la cissoïde 
X, les anneaux locaux sur X aux points 
(a, b) ^ (0, 0) sont isomorphes à ceux des 
points correspondants sur la droite. Au 
contraire, l’anneau local, O x < 00 ) n’est pas 
intégralement clos (il ne contient pas 
l’élément entier yj je), tandis que tous les 
anneaux locaux sur la droite sont intégra- 
lement clos. On voit donc que le point de 
rebroussement de la cissoïde se manifeste 
dans les propriétés des anneaux locaux 

(fig. 2). 

Un raisonnement analogue permet 
d’étudier le cône d’équation z 2 “ X 2 + y 2 
dans k 3 . Les fonctions rationnelles sur 
cette surface forment un corps, extension 
quadratique de k(x, y) ; elles s’écrivent 
R(x, y) + zS(x, y). L’anneau local de l’ori- 
gine est formé de ceux de ces éléments 
pour lesquels les fractions R et S sont 
définies en (0, 0), et son idéal maximal est 
défini par la condition R(0,0) = 0. 

Faisceau structural 

La connaissance de la topologie et des 
anneaux locaux sur un ensemble algébrique 
est insuffisante pour caractériser cet ensem- 
ble à isomorphisme près ; en particulier, 
elle ne permet pas de reconstituer l’algèbre 
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des fonctions régulières sur l’ensemble. 
Nous allons remplacer les anneaux locaux 
par une structure plus riche. 

Considérons un ouvert de Zariski U 
dans un ensemble algébrique X. Nous 
dirons qu’une application de U dans k est 
une fonction régulière dans U si son germe 
en chaque point X de U appartient à 
l’anneau local 0 X v ; l’ensemble des fonc- 
tions régulières dans U forme un anneau 
(et même une k-algèbre), que nous note- 
rons O, (U). Notre terminologie n’est pas 
contradictoire, car 0 x (X) est précisément 
l’ensemble des fonctions régulières sur X, 
en vertu du théorème : 

Soient X un ensemble algébrique et / : 
X — ► k une application de X dans k. On 
suppose que pour tout point X de X il existe 
un voisinage V Y de X et une fonction 
rationnelle i\ définie dans V x et telle que 
/ 1 y = r x . Alors / est une fonction régu- 
hère. 

Ce résultat se démontre ainsi, dans le cas 
où X est affine : on peut supposer que les 
voisinages V x sont de la forme D(g x ) 
(ensemble des points oùg x ne s’annule pas), 
avec des fonctions régulières g,. Comme les 
Dfe) recouvrent X, l’idéal engendré par les 
fonctions g x est l’anneau A de toutes les 
fonctions régulières sur X (sinon on pour- 
rait trouver un idéal maximal contenant les 
g x , donc un point de X où toutes ces 
fonctions s’annulent) ; par suite, 1 est 
combinaison linéaire d’un nombre fini de 
fonctions g x soient g ]5 g 7 , . . . . g s et 
x = D(g,) U D(g 2 ) U Ù D(&). Dans 
l’ouvert D(g ; ), /coïncide avec une fonction 
rationnelle f) définie dans D(g ( ) ; ici nous 
avons besoin d’un lemme : toute fonction 
rationnelle définie dans D(g,) peut s’écrire 
sous la forme h/ g f où h est une fonction 
régulière et m un entier (car g ( s’annule sur 
l’ensemble des zéros du dénominateur, 
donc, par le Nullsîeliensatz , ce dénomina- 


teur divise une puissance de g/ Nous 
pouvons donc trouver un entier m et des 
fonctions régulières /q, h 2 , . . . . h s tels que 
g^f coïncide avec hj dans D(g,) ; dans 
D(g,) fl D(g / ) = D(g,g,), les fonctions g^hj 
et gy'hj sont égales, et par suite leur diffé- 
rence est annulée par ggj. Il existe des 
fonctions régulières /,/>,. . . . / telles que 

/lgl"' +1 +flg2 m+l + + M' + ‘ = 1 ■ 
car les D (g f j 1+i ) recouvrent X; on peut 
alors vérifier que f coïncide avec f\g\h\ 

+ fiê2 h 2 + + fsgsK dans Chaque 

D(g,), donc lui est égale. 

On appelle faisceau d’anneaux sur un 
espace topologique X un couple (A, p) du 
type suivant : A associe à chaque ouvert U 
de X un anneau A(U) et p associe à chaque 
couple (U, V) d’ouverts tels que U C V un 
hornorphisme Pyy : A(V) — ► A(U) appelé 
restriction de V à U. On impose à ces 
données les conditions suivantes : 

(1) Pour tout ouvert U, l’homo- 
morphisme p ULI est l’application identique 
de A(U) . Si UCVCW, on a 
Puw = Puv 0 Pvw* 

(2) Pour tout ouvert U et tout recou- 
vrement (U,) /e de U par des ouverts, 
l’application f h-*. ( py/u(/)) est une bijec- 
tion de A(U) sur l’ensemble des familles : 

</•,)€ H A(U;), 

i€I 

telle que les restrictions de/ et/ à U, P) U, 
soient égales pour tout couple (/, f) d’indi- 
ces. Cela signifie qu’un élément de A(U) 
est connu quand on connaît ses restrictions 
à tous les U,-, et donne la condition pour 
que des éléments des A(U,) proviennent 
par restriction d’un même élément de 

A(U). 

La fibre A, du faisceau en un point Y de 
X est la limite inductive des A(U) lorsque 
U parcourt l’ensemble filtrant des voisina- 
ges ouverts de x ; pour construire cette 
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limite inductive, on identifie des éléments 
de A(U) et A(V), où U et V sont des 
voisinages ouverts de .y, si leurs restrictions 
à un voisinage W C U Pi V sont égales ; les 
classes d’équivalence ainsi définies sont les 
éléments de A,. 

11 est clair que les anneaux de fonctions 
Ox(U) que nous avons définis sur un 
ensemble algébrique X forment un fais- 
ceau d’anneaux (avec la notion habituelle 
de restriction). Les fibres sont les anneaux 
locaux 0 X v . Considérons une application 
régulière u : X-t Y d’ensembles algébri- 
ques ; elle est continue pour les topologies 
de Zariski, de sorte que si V est un ouvert 
de Y, w - l (V) est un ouvert de X. On a alors 
un homomorphisme g g o U de 0 Y (V) 
dans O x (w -, (V)). D’une manière générale, 
on appelle espace localement annelé un 
espace topologique X muni d’un faisceau 
d’anneaux (A, p) dont les fibres sont des 
anneaux locaux. Un morphisme d’espaces 
localement annelés de (X, (A, p)) dans (Y, 
(B, a)) est un couple (w, v) où u est une 
application continue de X dans Y et v 
associe à chaque ouvert V de Y un 
homomorphisme V v : B(V)— >-A(m _ 1 (V)) de 
manière compatible avec les restrictions p 
et (J. On impose de plus que, pour tout 
point x de X, l’ homomorphisme 
v x : — + A, déduit de y soit un homo- 

morphisme local. Il est facile de définir le 
morphisme composé de deux morphismes, 
puis la notion d’isomorphisme entre espa- 
ces localement annelés. 

Soit U un ouvert d’un espace locale- 
ment annelé (X, (A, p)). La topologie 
induite et le faisceau induit 
AJ y : U’ A(U’), pour U’ ouvert contenu 
dans U, font de U un espace localement 
annelé ; on dit que c’est un sous-espace 
ouvert de X. Par exemple, si X est un 
ensemble algébrique affine et si f est une 
fonction régulière sur X, l’ensemble D (f) 


des points de X oùf’ n’est pas nulle, muni 
de la structure d’espace annelé induite par 
celle de X, est un sous-espace ouvert de X. 
Si X est défini, dans k n , par les équations 

S\ — °> Si = °> • • - • & = °> et si / est la 

restriction à X d’un polynôme /£ k[x { , 
x 2 , . . . . X n \, alors D(f) est la projection sur 
k n de l’ensemble algébrique Y C k u+] = 
k n X k défini par les équations g, = 0, 
g-y = 0, g s = 0 et 1 — tf = 0. La pro- 
jection : (x, t ) X définit un isomor- 
phisme d’espaces localement annelés de Y 
sur D(/). Par exemple, le complémentaire 
de 0 dans la droite k est isomorphe, comme 
espace localement annelé, à l’hyperbole 
d’équation xt = 1 dans le plan des (j, t ) 

(fig. 5). 



Nous pouvons aussi munir D(/) d’une 
structure de variété algébrique affine, en 
transportant celle de Y. Soit A = 
k[ A'j, Ab, A', J/a l’algèbre de la variété 
affine X, où a est l’idéal engendré par gj, 
g 2 , g L’algèbre de Y est 
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k[x { , x 2 , -, x„,t ]/b où b est engendré par 
g J, g-,, g et 1 — tf\ elle est isomorphe à 
Af — A[t ]/( 1 — tf'\ en désignant parf’ la 
classe de f dans A. Dorénavant, si (X, A, 
cp) est une variété algébrique affine et si g 
est un élément de A, nous munirons 
l’ouvert D (f) des points de X où f n’est pas 
nul d’une structure de variété algébrique 
affine au moyen de l’algèbre A,= A[t ]/ 
(1 tf) ; les éléments de cette algèbre 
peuvent s’écrire comme des fractions du 
type hjf r où h G A (notons qu’une telle 
fraction est nulle dès que h est annulé par 
une puissance de /, soit f m h - 0 ; cela 

n’exige pas que h soit nul). On peut 
montrer qu’il existe sur X un faisceau 0 X 
et un seul qui prennent la valeur A, dans 
l’ouvert D (f) pour tout f G A. Si U est un 
ouvert de X, les éléments de 0 X (U) ne sont 
pas des fonctions dans U, mais chacun 
d’eux définit une fonction (régulière) dans 
U : cette fonction est nulle si. et seulement 
si, l’élément considéré est nilpotent. La 
fibre de 0 X v en un point X est un anneau 
local, dont les éléments s’écrivent comme 
des fractions h/g avec /ï, g (E A et 
g(x) 0 ; ainsi (X, 0 X ) est un espace 
localement annelé. 

Si (w, v) : (X, A, cp) — ► (Y, B, ip) est un 
morphisme de variétés algébriques affines, 
on en déduit aisément un morphisme (w, 
v) : (X, 0 X ) — ► (Y, 0 Y ) en définissant v D( ^, 
pour g (E B, comme l’ homomorphisme de 
B ? dans A v{g) qui transforme h/g 1 ' en 
v(h)/(g)“. Inversement, si (u, K’) : (X, O x ) — ► 
(Y, 0,) est un morphisme d’espaces loca- 
lement annelés, (w, h j y ) est un morphisme 
de variétés affines ; on a (v) Y — v et 
( VV’ Y ) = w. Cela implique en particulier que 
deux variétés algébriques affines sont iso- 
morphes si, et seulement si, elles sont 
isomorphes comme espaces localement 
annelés. Dans la suite, nous considérerons 


les variétés algébriques affines comme des 
espaces localement annelés. 

Considérons maintenant un ensemble 
algébrique X défini dans l’espace projectif 
P,,(k) par des équations homogènes 
gl = 0, gi = 0, . . . . g s = 0, et un polynôme 
f homogène de degré d par rapport aux 

coordonnées homogènes X„. Soit 

D +(/•) l’ensemble ouvert des points de X 
où f n’est pas nul, muni de la structure 
annelée induite par celle de X ; il est 
isomorphe à un ensemble algébrique 
affine. On le voit tout de suite si f = x 0 , en 

utilisant l’isomorphisme connu de k n sur le 
complémentaire de l’hyperplan d’équation 
Xq = 0 dans P,(k) ; si d = 1, un change- 
ment de coordonnées nous ramène a ce cas 
facile. Le cas général se ramène au cas où 
d = 1 en identifiant P,(k) à la variété de 
Veronese (cf. chap. 1). 

Cela permet encore de munir D+(f) 
d’une structure de variété algébrique 
affine, dont l’algèbre est obtenue ainsi : soit 
a l’idéal homogène de polynômes engendré 

par gi, g 2 , g s , et soit A = k[x 0 , X,, 

*„]/« l’algèbre graduée quotient ; dési- 
gnons par A (t/) la sous-algèbre de A formée 
des éléments dont le degré est un multiple 
de d; l’algèbre de D+(f) est = A 
if— 1) et ses éléments s’écrivent comme 
des fractions hjf r où h est un élément de 
degré rd de A. Il existe alors un faisceau 
d’anneaux bien déterminé sur X qui prend 
la valeur A„ sur D+(/ ) ; sa fibre en un 
point x est un anneau local, dont les 
éléments sont les fractions du type hjg avec 
/z, g G A homogènes de même degré et g 
non nul en x. Nous désignerons ce faisceau 
par ü x , et nous dirons que l’espace loca- 
lement annelé (X, 0 X ) est une variété 
algébrique projective. On peut montrer 
que pour tout morphisme d’espaces loca- 
lement annelés (w, w) : (X, 0,) — ► (Y, 0 Y ) 
entre des variétés algébriques projectives. 
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l’application u est régulière (on commence 
par observer que la restriction de u à tout 
ouvert affine de la forme D + (/) C X est 
régulière). 

La notion d’espace localement annelé 
nous a permis de traiter de manière 
analogue les variétés algébriques affines ou 
projectives. De plus, toute variété algébri- 
que projective X C P„(k) peut être recou- 
verte par des ouverts U, qui sont des 
variétés affines pour la structure induite ; 
on peut même prendre des U, en nombre 
fini, par exemple U,- = D + (x,) (jq coor- 
données homogènes). D’une manière 
générale, nous dirons qu’un espace loca- 
lement annelé (X, ü x ) est une variété 
algébrique s’il existe un recouvrement (U,) 
de X par des ouverts qui sont isomorphes 
(pour la structure localement annelée 
induite) à des variétés algébriques affines. 


4. Propriétés élémentaires 

Tout ouvert U d’une variété algébrique X, 
muni de la structure annelée induite, est 
une variété algébrique ; on dit que c’est une 
sous-variété ouverte de X. 

Considérons un faisceau d’idéaux 3 de 
0 X (c’est-à-dire un faisceau tel que J(U) 
soit un idéal de 0,(U) pour tout ouvert U, 
les opérations de restriction de 3 étant 
induites par celles de O x ) ; on peut définir 
un faisceau quotient 0 x /3, dont la fibre en 
un point X quelconque de X est 0 Xv /3 Y . Si 
3 est « localement de type fini », le support 
Y de ce faisceau quotient, c’est-à-dire 
l’ensemble des points x où sa fibre n’est pas 
nulle, est une partie fermée de X. On peut 
considérer 0 x /3 comme un faisceau sur Y, 
et Y muni de ce faisceau est une variété 
algébrique ; on dit que c’est une SOUS- 
variété fermée de X. Par exemple, les 
variétés algébriques affines (resp. projec- 


tives) peuvent être considérées comme des 
sous-variétés fermées d’un espace k n (resp. 

p„(*)). 

Si Y est un fermé quelconque de X, le 
faisceau d’idéaux 3 y f° rm é des / qui 
s’annulent sur Y est localement de type fini 
et é) x /3y a pour support Y, d’où sur Y une 
structure de sous-variété fermée de X. Ce 
n’est pas la seule possible, mais on peut la 
caractériser par le fait qu’elle est réduite , 
c’est-a-dire que son faisceau structural ne 
comporte pas d’éléments nilpotents non 
nuis (il s’interprète comme un faisceau de 
fonctions sur Y). En particulier, si Y = X, 
on définit une sous-variété fermée X rc(1 de 
X qui est réduite et a même espace 
topologique sous-jacent que X. 

Sur l’ensemble produit X X Y de deux 
variétés algébriques, on peut définir une 
structure de variété algébrique munie de 
morphismes p : XXY-X et 
q : X X Y — ► Y, de manière que les mor- 
phismes u d’une variété Z dans X X Y 
correspondent bijectivement aux couples 
(p o U, Cf o u) de morphismes de Z dans X 
et Y respectivement. En général la topo- 
logie de X X Y est strictement plus fine 
que la topologie produit. Par exemple 
k’” X k” ~ • le produit de deux varié- 

tés affines est par suite une variété affine. 
De même, le produit de deux variétés 
projectives est projective ; en effet, 
P ; „(A:) X P,,(k) s’identifie à une sous- 
variété fermée de P,.(k), avec Y = mn -h ni 

n, au moyen du morphisme de Segre 
qui transforme un couple (.y, 
>■) G P,„(A:) X P„(A:) en le point de coor- 
données homogènes x$j (0 ^ i ^ m, 
0 ^ j ^ n) où les Xj sont les coordonnées 
homogènes de x et les }’j celles de y. Par 
exemple, pour m = n = 1, le morphisme 
de Segre P,(k) X P,(k) — P,(k) identifie 
le produit de deux droites projectives à la 
quadrique d’équation homogène zt = AT 
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(cf. chap. 1, exemple des paraboloïdes et 
fig. 3) ; lorsque a décrit P,(k), l’image de 
{a} X P,(k) décrit l’un des systèmes de 
génératrices rectilignes de la quadrique, 
tandis que l’image de P,(k) X { a } décrit 
l’autre système. 

On dit qu’une variété algébrique X est 
séparée si la diagonale A x = {(x, x) 

X £: rX} est une partie fermée de X X X 
(comme la topologie de X X X est plus fine 
que la topologie produit, cela ne signifie 
pas en général que la topologie de X est 
séparée). Une sous- variété (ouverte ou 
fermée) d’une variété séparée est aussi 
séparée ; de même, un produit de variétés 
séparées est séparé. L’espace k n et l’espace 
P,(k) sont séparés, donc les variétés algé- 
briques affines ou projectives sont sépa- 
rées. 

La propriété noethérienne des algèbres 
de type fini se traduit dans le fait que toute 
suite décroissante de fermés d’une variété 
algébrique affine est stationnaire. Il en 
résulte que tout sous-espace d’une telle 
variété est quasi compact, c’est-a-dire véri- 
fie l’axiome de Borel-Lebesgue (cf. topo- 
logie générale) . Les variétés algébriques 
qui sont quasi compactes sont celles qui 
admettent un recouvrement fini par des 
ouverts affines ; il en est ainsi pour les 
variétés affines ou projectives. Les variétés 
algébriques au sens de Serre sont suppo- 
sées réduites, séparées et quasi compactes. 

Une variété non vide qui n’est pas 
réunion de deux fermés strictement plus 
petits est dite irréductible ; il revient au 
même de dire que tout ouvert non vide est 
partout dense. L’espace k n et l’espace 
P,(k) sont irréductibles. Toute variété 
algébrique quasi compacte est réunion 
d’un nombre fini de composantes irréduc- 
tibles, qui sont ses parties fermées irréduc- 
tibles maximales. 


La dimension d’une variété algébrique 
X est définie comme la borne supérieure de 
l’ensemble des entiers n pour lesquels il 
existe une suite strictement croissante de 
(F„ F„ . . . . F,) de fermés irréductibles de 
X ; c’est un nombre fini si X est quasi 
compacte. Si X est une variété intègre, 
c’est-à-dire irréductible et réduite, on peut 
définir des fonctions rationnelles sur X ; ces 
fonctions forment un corps K(X), exten- 
sion de type fini de k dont le degré de 
transcendance est égal à la dimension de X 
(cf. corps) . Ainsi l’espace k" et l’espace 
P,(k) sont de dimension n , leur corps de 
fonctions rationnelles étant k(x \,X 2 , .... x,). 

Si k est le corps des nombres comple- 
xes, on peut considérer k n = C", comme 
une variété analytique complexe. Toute 
variété algébrique affine X, sous-variété 
fermée de C n peut alors être munie d’une 
structure d’espace analytique X an SOUS- 
espace analytique fermé de C" (la topolo- 
gie de X an est induite par la topologie 
transcendante de C n et son faisceau struc- 
tural est quotient du faisceau des fonctions 
analytiques). Considérons maintenant une 
variété algébrique X sur C, recouverte par 
des ouverts affines U, ; les structures ana- 
lytiques Uf se recollent et définissent sur 
X une structure d’espace analytique X cm , 
de même dimension que X. Un grand 
nombre de propriétés de géométrie algé- 
brique concernant X se traduisent par des 
propriétés analytiques de X an . 

Par exemple, on peut définir la notion 
de point régulier d’une variété algébrique 
X ; si le corps de base est C, pour qu’un 
point .v de X soit régulier, il faut et il suffit 
que X an soit une variété analytique sans 
singularité au voisinage de x. Ainsi, tout 
point de C n ou de P„(C) est régulier, mais 
0 n’est pas un point régulier de la cissoïde 
représentée dans la figure 2 (on dit que 
c’est un point singulier). L’ensemble des 
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points réguliers d’une variété algébrique 
est ouvert, et il est partout dense si la 
variété est réduite. L’anneau local en un 
point régulier est factoriel (cf. ANNEAUX 

COMMUTATIFS). 

Comme autre exemple, considérons la 
notion de variété algébrique complète 
(définie sur un corps de base arbitraire). 
Dans le cas où le corps de base est C, pour 
que X soit complète il faut et il suffit que 
X"" soit compact. On voit ainsi que P„(C) 
et que les variétés algébriques projectives 
sont des variétés complètes. Au contaire, 
les variétés affines de dimension non nulle 
ne sont pas complètes. 

Dans la suite de cet article, nous rem- 
plaçons les définitions de certaines notions 
de géométrie algébrique par leurs traduc- 
tions transcendantes, en nous restreignant 
au cas où le corps de base est C ; c’est le 
point de vue de la géométrie italienne du 
siècle dernier (on démontrait alors les 
théorèmes par des méthodes transcendan- 
tes). Nous pourrons ainsi énoncer un 
certain nombre de résultats sans être 
entraînés à des développements trop 
longs ; cependant, ces résultats conservent 
leur sens et leur validité avec un corps de 
base général. 


5. Morphismes finis. Normalisation 
et désingularisation 

On dit qu’un morphisme f — (u, 
v) .* X — ► Y de variétés algébriques affines 
est fini si v Y : B •—+ A fait de A une 
B-algèbre finie (A désigne l’algèbre de X et 
B celle de Y). Plus généralement, un 
morphisme f : X — ► Y entre des variétés 
algébriques quelconques est dit fini s’il 
existe un recouvrement de Y par des 
ouverts affines U, tels que les ouverts 
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/"* (U,-) de X soient affines et que les 

restrictions : 

/l/’- 1 (U;) : / _ 1 (U/) “ * U/ 

soient finies. Un morphisme fini trans- 
forme les fermés de X en fermés de Y, et, 
pour tout point y de Y, la fibre f~ x (ÿ) est 
finie et discrète. Le lemme de normalisa- 
tion de Noether, énoncé au chapitre 2, 
signifie que si X est une variété algébrique 
affine, il existe un morphisme fini et 
surjectif de X sur un espace k ü ; l’entier d 
est égal à la dimension de X. Si X est une 
sous-variété fermée d’une variété Y. le 
morphisme d’injection X — ► Y est fini. 

Soit f : X — ► Y un morphisme de 
variétés algébriques tel que pour tout 
point y de Y la fibre f '(y) soit finie et 
discrète. En général / n’est pas fini, mais, 
si on le suppose séparé (cela signifie que 
A x = {(x, x) X G XI est fermé dans le 
« produit fibré » X X Y X ; c’est toujours 
vrai si X est séparé), on peut montrer qu’il 
existe une variété algébrique X’ dans 
laquelle X se plonge comme sous-variété 
ouverte de manière que f se prolonge en 
un morphisme fini de X’ dans Y. Ce 
résultat, profond et difficile, est connu 
sous le nom de théorème principal de 
Zariski. 

Un point x d’une variété algébrique X 
est dit normal si l’anneau local 0 Xv est 
intègre et intégralement clos. Sur le corps 
des complexes, cela revient à dire que x est 
un point normal de X rt ", c’est-à-dire que 
toute fonction analytique définie seule- 
ment aux points réguliers voisins de A' et 
bornée se prolonge en une fonction ana- 
lytique définie dans un voisinage de x. Un 
point régulier est normal ; sur une courbe 
la réciproque est vraie, mais pas en dimen- 
sion plus grande. Par exemple, le sommet 
0 du cône d’équation zr — X 2 + y 1 dans k 2 
est normal sans être régulier (cf. chap. 3 et 
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fig. 6 



fig. 6). En un point normal .y, chaque 
composante irréductible de l’ensemble S 
des points singuliers est de codimension au 
moins 2 ; par exemple, si X est une courbe, 
JC a un voisinage qui ne contient aucun 
point singulier ; si X est une surface, il 
existe un voisinage de x qui ne contient pas 
d’autre singularité que X 

Soit X une variété algébrique affine 
intègre, d’algèbre A. On démontre que la 
clôture intégrale À de A (ensemble des 
éléments du corps K(X) qui sont entiers 
sur A ; cf. ANNEAUXCOMMUTATIFS) est finie 
sur A ; il lui correspond une variété algé- 
brique affine X dont tous les points sont 
normaux, munie d’un morphisme fini 
X X. On généralise ce résultat en asso- 
ciant à toute variété réduite X une variété 
normale X et un morphisme TT : X — ► X fini 
et surjectif qui induit un isomorphisme de 
X — 71^ 1 (Z) sur X Z en désignant par Z 


l’ensemble des points de X qui ne sont pas 
normaux (c’est un fermé sans point inté- 
rieur) ; les variétés X et X sont biration- 
nellement équivalentes. Lorsque X est une 
courbe, X est une courbe sans point 
singulier ; par exemple si X est unicursale 
et affine, X est isomorphe à. k, et TT donne 
une représentation paramétrique de X (cf. 
fig. 2 et fig. 7). 



Normalisation d'une strophoide 


11 est beaucoup plus difficile d’éliminer 
d’une manière analogue les singularités des 
variétés de dimension plus grande. Ce 
problème a été résolu par S. Abhyankar 
pour les surfaces et par H. Hironaka pour 
les variétés de dimension quelconque sur 
un corps de caractéristique 0 ; on associe 
à une variété algébrique X une variété X’ 
sans point singulier et un morphisme 
surjectif cp : X’ — ► X (non fini en général) 
qui est une équivalence birationnelle et un 
isomorphisme de X’ cp _1 (S) sur X S (S 
désignant l’ensemble des points singuliers 
de X). 
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6. Faisceaux cohérents 
et cohomologie 

Les méthodes cohomologiques sont, 
comme dans la théorie des espaces analy- 
tiques, un des outils les plus puissants de la 
géométrie algébrique. La topologie de 
Zariski permet de développer une théorie 
de la cohomologie à valeur dans les fais- 
ceaux algébriques cohérents sur les varié- 
tés algébriques. 

Considérons une variété algébrique (X, 
ü x ). On définit un faisceau de O x -modules 
,T, ou faisceau algébrique sur X, en asso- 
ciant à chaque ouvert U de X un 0 X (U)- 
module ^(U) et en se donnant, pour 
U C Y, des opérations de restriction 
y (V) F(U) « semi-linéaires » relative- 
ment à celles de 0,. Ces données sont 
soumises à des axiomes (1) et (2) analogues 
à ceux énoncés au chapitre 3 pour les 
faisceaux d’anneaux. La fibre : 

$ x - lim $ (U), 

U5X 

en un point A' de X est un O x v -module. Un 
morphisme u d’un faisceau algébrique ,T 
dans un autre S est la donnée, pour chaque 
ouvert U de X, d’une application 0x(U)- 
linéaire de U\j de (U) dans Ç(U) ; si 
U CV, on impose que Wy et Wy soient 
compatibles avec les restrictions de V à U 
dans 3 et 8. Par exemple, si X est une 
variété algébrique affine, d’algèbre A, et si 
M est un A-module, on peut lui associer un 
faisceau algébrique M dont la valeur dans 
un ouvert D(f) de X avec f £ A, est 
M, = M[f]/( 1 tf) MW (les éléments de 
M/ se représentent comme des fractions 
m/f avec ïïl E M) ; à toute application 
A-linéaire y : M — » N entre A-modules 
correspond un morphisme ÿ : M — ► N de 
faisceaux algébriques ; le faisceau O x est 
égal à A, 


On peut montrer que le fait, pour un 
faisceau algébrique $ sur la variété affine 
X, d’être isomorphe à un faisceau M, où 
M est un A-module, est une propriété 
locale. On peut donc définir une propriété 
correspondante sur toute variété algébri- 
que. Nous dirons qu’un faisceau algébri- 
que $ sur une variété algébrique X est 
cohérent s’il existe un recouvrement de X 
par des ouverts affines U, d’algèbres A,* et 
des A, -modules de type fini M, tels que la 
restriction de & à U; soit isomorphe à M, 
pour tout i. Par exemple, si tt : E — *■ X est 
un fibré vectoriel algébrique localement 
trivial, on lui associe un faisceau cohérent 
£ dont la valeur dans un ouvert U est 
l’ensemble des morphismes a : U — ► E tels 
que TT o Q soit l’injection canonique de U 
dans X (« sections de E au-dessus de U ») ; 
le faisceau £ est même localement libre, 
c’est-à-dire qu’on peut choisir les ouverts 
U, de manière que £ u ~ M ; - où M, est un 
module libre de type fini. 

À un faisceau algébrique cohérent 
sur une variété algébrique X, on associe les 
groupes de cohomologie H"(X,,T) 
(n E N) ; on a H°(X, -T) — F(X). Si X est 
affine, H"(X, .T) = 0 pour n ^ 1 et pour 
tout faisceau cohérent .T ; cette propriété 
(analogue au théorème B de Caftan en 
géométrie analytique) caractérise les varié- 
tés algébriques affines. 

Pour étudier la cohomologie d’une 
sous-variété fermée de l’espace projectif 
P,.(k), on utilise le faisceau fondamental 
0( 1) ainsi défini. Désignons par tt l’appli- 
cation canonique {0} sur P,.(A:), et 

considérons la sous-variété algébrique E de 
P Xk) X k r+ 1 définie par les conditions 
£ = 0 ou £ ^ 0 et 7f(0 = x(.V £ P r (£), 

£ + et obtenue en faisant « éclater 

0 » dans /d +1 (cf. fig. 3 pour le cas r = 1) ; 
c’est un sous-fibré vectoriel de rang 1 du 
fibré trivial P,.(^) X k'^ [ de base P,(k) et 
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de fibre k r+ 1 . Le faisceau 0( 1) des sections 
du fibré dual E* est localement libre de 
rang 1 et H°(P p 0( 1)) s’identifie à l’ensem- 
ble des formes linéaires sur k r+x ; sa 
puissance tensorielle n-ième, notée 0(rt), 
est encore un faisceau localement libre de 
rang 1 et H°(P p 0(n)) s’identifie à l’ensem- 
ble des polynômes homogènes de degré n 
sur k r+l . Si X est une sous -variété fermée 
de P,.(k), nous désignerons par 0 X (1) le 
faisceau des sections du dual de 
Ex = X X Pr E, et par O x (n) la puissance 
tensorielle n-ième de ce faisceau ; ce sont 
des faisceaux localement libres de rang 1 
sur X ; enfin, si (F est un faisceau algébri- 
que cohérent sur X, le produit tensoriel : 

9 ® o x °x(«) 

est noté (F( n ). J.-P. Serre a démontré que, 
pour un faisceau cohérent (F donné, il 
existe un entier n {) tel que H Ç (X, (F (n)) = 0 
pour n ^ et q ^ F De plus H f/ (X, 3) 
est un k-espace vectoriel de dimension finie 
pour tout q et s’annule pour q > dim X. 
Plus généralement FF(X, 3) est de dimen- 
sion finie sur k pour tout q lorsqu’on 
suppose seulement que X est complète. 

Lorsque k = C, à tout faisceau algé- 
brique cohérent (F sur une variété algébri- 
que X correspond un faisceau analytique 
cohérent !F an sur l’espace analytique X an . 
Si X est projective, on a H"(X, 
^F) — H /7 (X rt/î , 3 ran ) pour tout n ; on peut 
en déduire que tout sous-espace analytique 
fermé Y de P,.(C) est de la forme X an où 
X est une variété algébrique (théorème de 
Chow) et que tout faisceau analytique 
cohérent S sur Y est de la forme F an où (F 
est un faisceau algébrique cohérent bien 
déterminé sur X. 

Considérons une variété algébrique X 
sur le corps des nombres complexes. Les 
propriétés topologiques de X ün (topologie 


transcendante) se manifestent dans les 
groupes de cohomologie à valeur dans des 
faisceaux constants, par exemple dans les 
groupes W n (X an , Z). Les groupes corres- 
pondants calculés sur X avec la topologie 
de Zariski n’ont pas les propriétés raison- 
nables attendues, car la topologie de 
Zariski est trop grossière ; par exemple, il 
existe des « revêtements » Y — ► X (ou Y”” 
sur un revêtement de X an ) qui ne sont pas 
localement triviaux pour la topologie de 
Zariski. Cependant Grothendieck est par- 
venu à construire une théorie cohomolo- 
gique valable sur un corps de base général 
et donnant de bons groupes de cohomo- 
logie à valeur dans des faisceaux constants 
(cohomologie étaie) ; si k - C, la cohomo- 
logie étale à valeur dans Z/nZ coïncide 
avec la cohomologie transcendante. À 
partir des mêmes idées, on peut même 
développer une théorie de l’homotopie des 
variétés algébriques (M. Artin). 


7. Intersections 

Définitions 

Soit Y un fermé irréductible d’une variété 
algébrique X. La codimension de Y dans X 
est définie comme la borne supérieure des 
entiers n tels qu’il existe une suite stricte- 
ment croissante (F 0 , F,, . . . . F,,) de fermés 
irréductibles de X avec F 0 = Y ; si X est 
irréductible : 

codim x (Y) = dim X — dim Y. 

Supposons maintenant que X est une 
variété sans point singulier, et considérons 
des fermés irréductibles Y et Z de X ; si W 
est une composante irréductible de Y H Z, 
on a l’inégalité suivante : 

codim W ^ codim Y + codim Z 
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(par exemple, dans l’intersection de deux 
hypersurfaces, toutes les composantes irré- 
ductibles sont de codimension au plus 2). 
On dit que Y et Z se coupent proprement 
en W dans le cas où il y a égalité : 

codim W = codim Y + codim Z 

(formule des dimensions) ; on peut alors 
définir un entier m w appelé multiplicité de 
W dans l’intersection de Y et Z (cf. 
COURBES ALGÉBRIQUES, pour le cas où Y et 

Z sont des courbes). Si Y et Z se coupent 
proprement en toutes les composantes 
irréductibles de Y fl Z, on dit que l’inter- 
section de Y et Z est propre, et on peut 
définir un « cycle » intersection : 



(somme étendue aux composantes irréduc- 
tibles de Y fl Z). D’une manière générale, 
nous appellerons cycle de codimension m 
une combinaison linéaire formelle à coef- 
ficients entiers de fermés irréductibles de 
codimension m , et nous désignerons par 
Z”‘(X) le groupe additif des cycles de 
codimension m . On peut aussi définir la 
notion de cycles qui se coupent propre- 
ment ; si Z £ Z m (X) et z G Z W '(X) sont des 
cycles qui se coupent proprement, leur 
produit d'intersection z.z' est défini, et c’est 
un cycle de codimension m + m'. Voici les 
propriétés fondamentales du produit 
d’intersection : 

(1) Soit z G Z'"(X) et z j, z' 2 E Z'"'(X) ; 
si z.z i et z.z’ -y sont définis, il en est de même 
de Z.(z\ + -\) et z.(:\ + z' 2 ) ~ 

\ -f- Z.Z* 2- 

(2) Commutativité : z.z' z .Z (si l’un 
des membres est défini, l’autre l’est 
aussi). 

(3) Associativité : z.(z'.z") — (z.z').z" 
lorsque les deux membres sont définis. 


Soit z G Z”‘(X) et TE Z” (Y) où X et Y 
sont des variétés sans singularité ; on définit 
un cycle produit z X t E Z"' +M (X X Y). 

Alors si Z.Z et t . f sont définis, il en est 
de même de (z X t ) (z’ X f) et donc 
(z Xt) (:■ X t’) = (z.z’) X (W). 

Soit / : X — * Y un morphisme de 
variétés irréductibles sans singularité. 
On définit l’image directe /* 
Z"'(X) Z'” + '(Y) (r = dim Y - dim X) ; 

c’est une application additive telle que : 

/*( W) = 0 si dim/(W) < dim W, 

f*(W) = df( W) si dim f (W) = dim W, 

avec d = [K(W) : K(/ (W))] (degré de W 
comme revêtement ramifié de f(W) ; W 
est un fermé irréductible de X). L’image 
réciproque j*(t ) d’un cycle t sur Y n’est pas 
toujours définie ; on pose f*(t ) = 
p*((X X t).rA où p est la projection de 
X X Y sur X et Tj est le graphe de f 
La codimension est conservée par /*, et on 

a f (h + h) =f (h) +f(h) et 

j * (t.t') = /*(/ lorsque les deux 

membres sont définis. Si des cycles z et z 
sur X se coupent proprement, on a 
Z.z’ - 5*x(z X z’) où ô x : x »— ► (x, x) est le 
morphisme diagonal de X dans XXX. 
Considérons un cycle z sur X et un cycle 
t sur Y ; on a la formule de projection 
f* (z .J*(t )) = f*(z) t (si les deux mem- 
bres sont définis). 

La théorie des intersections utilise 
diverses notions d’équivalence de cycles 
(linéaire, algébrique, numérique ; cf. cour- 
bes algébriques) ; ces relations d’équiva- 
lence sont compatibles avec l’addition des 
cycles et avec le produit d’intersection (et 
même avec les opérations/* et/*). Si z et 
z’ sont des cycles quelconques sur une 
variété X, le produit z.z n’est pas défini en 
général, mais il existe un cycle z\ équiva- 
lent à z qui coupe proprement z ; il en 
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résulte une loi quotient partout définie. Les 
propriétés (1), (2) et (3) montrent que 
l’ensemble des classes de cycles a une 
structure d’anneau commutatif. 

Théorème de Riemann-Roch 

Soit 3 un faisceau cohérent sur une variété 
algébrique projective X sans singularité. 
La caractéristique d’Euler-Poincaré de 3 
est définie par : 

X(X, *) - TJ— 1)'- dim H'(X, ^). 

Le théorème de Riemann-Roch 
exprime %(X, 3) au moyen de classes de 
cycles liées à 3 et à X jouant le rôle de 
classes de Chern. Par exemple, si C est un 
faisceau localement libre de rang 1, il 
s’interprète comme le faisceau des sections 
d’un fibré linéaire Z ; si S est une section 
rationnelle de C, on lui associe un diviseur 
(s) = (s) 0 — (s)^, c’est-à-dire un cycle de 
codimension 1 sur X. On désigne par (s) 0 
l’image réciproque pars de la section nulle 
de C ; (s) x , se construit de même à l’aide de 
l/.ç. Lorsque X C P,(k) et que Z = 0 X ( 1) 
est le faisceau fondamental, (.?) est l’inter- 
section de X avec un hyperplan de P,(k). 
Lorsque 5 varie, le diviseur (s) reste dans 
une même classe pour l’équivalence 
linéaire, et cette classe D caractérise Z à 
isomorphisme près (première classe de 
Chern). 

Si X est une courbe, le théorème de 
Riemann-Roch donne, pour un faisceau Z 
localement libre de rang 1 : 

X(X, C) = dimH°(X, C)-dimH»(X, C) 

— deg D + 1 —g 

où deg D est le degré de la classe D, 
c’est-à-dire la somme des coefficients d’un 
diviseur quelconque appartenant à cette 
classe, et g est le genre de X (cf. COURBES 
ALGÉBRIQUES) . 


Supposons maintenant que X est une 
surface ; la formule de Riemann-Roch 
s’écrit : 

X(x, C) = dim H°(X, C) 

— dim H 1 (X, C) + dim H2(X, C) 

= t deg D . (D — K) + 1 +p„ 

où K est une classe de diviseurs, dite 
canonique, et liée au faisceau des formes 
différentielles sur X (ou au fibré tangent à 
X) et où p a est un entier appelé genre 
arithmétique de X. Les invariants numéri- 
ques, comme le genre arithmétique, ont été 
introduits initialement dans l’espoir d’arri- 
ver à une classification des variétés algé- 
briques. 

8. Groupes algébriques 

On appelle groupe algébrique une variété 
algébrique G munie d’un morphisme m : 
G X G — > G tel que pour toute variété 
algébrique T, l’application (u, v) ► 
m o (m, v) soit une loi de groupe sur 
l’ensemble G(T) des morphismes de T 
dans G ; si T est une variété affine, 
d’algèbre A, on écrit souvent G(A) au lieu 
de G(T) ; par exemple si T est la variété 
réduite à un point avec l’algèbre k , 
G(T) = G(k) s’identifie à l’ensemble des 
points de G (cf. chap. 2), et on voit que 
définit sur cet ensemble une structure de 
groupe. La théorie des groupes algébriques 
est assez analogue à celle des groupes de 
Lie, mais ses méthodes sont différentes. 

Comme premiers exemples de groupes 
algébriques, citons le groupe additif G ü , 
c’est-à-dire la droite affine (Je, k\î]) munie 
de l’addition comme loi, et le groupe 
multiplicatif G m , c’est-à-dire la variété 
affine (k — {0), k [ t , 1//]) munie de la 
multiplication ; on démontre que tout 
groupe algébrique affine de dimension 1 
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qui est connexe et réduit est isomorphe à 
G, ou à G,. L’ensemble GL (n,k) des 
matrices carrées inversibles d’ordre n est 
un ouvert affine dans M(n, k) C K' tX/î , 
défini par det (u {j ) ^ 0 ; la multiplication 
des matrices en fait un groupe algébrique 
affine. Tout groupe algébrique affine 
s’identifie à un sous-groupe fermé d’un 
GL (n, k) ; les groupes classiques sont des 
exemples de groupes algébriques (cf. 
groupes Groupes classiques et géomé- 
trie). 

On peut également définir la notion 
d’opérations algébriques d’un groupe algé- 
brique sur une variété algébrique. La 
théorie des groupes algébriques affines, 
édifiée par A. Borel, repose sur le théo- 
rème suivant : 

Considérons un groupe algébrique 
affine G résoluble et connexe , qui opère sur 
une variété complète X. Il existe un point 
de X invariant par les opérations de G. 

En appliquant ce résultat à un sous- 
groupe algébrique résoluble et connexe de 
GL(«, k) opérant sur la « variété des 
drapeaux » de k n , on trouve qu’un tel 
sous-groupe est conjugué d’un sous-groupe 
formé de matrices triangulaires ( théorème 
de Lie-Kolchin). On appelle sous-groupe de 
Borel d’un groupe algébrique affine G tout 
sous-groupe fermé résoluble connexe 
maximal ; les sous-groupes de Borel sont 
conjugués par automorphismes intérieurs. 
Si B est un sous-groupe de Borel de G, 
l’espace homogène G/B est une variété 
algébrique projective ; les sous-groupes H 
qui contiennent un sous-groupe de Borel 
(sous-groupes paraboliques) sont caracté- 
risés par le fait que G/H est une variété 
complète. 

À l’opposé des groupes affines se trou- 
vent les variétés abéliennes, c’est-à-dire les 
groupes algébriques connexes réduits qui 
sont complets en tant que variétés algébri- 


ques. Si A est une variété abélienne, c’est 
une variété projective et sa loi de groupe 
est commutative. Lorsque le corps de base 
k est celui des nombres complexes, 
l’espace analytique A”” associé à une 
variété abélienne A est un tore complexe 
C”/r (r sous-groupe additif discret de 
rang 2 n) ; on peut caractériser les tores 
complexes qui proviennent d’une variété 
abélienne par l’existence d’une forme de 
Riemann (c’est-à-dire une forme hermi- 
tienne positive non dégénérée sur Q n X C” 
dont la partie imaginaire prend des valeurs 
entières sur T X T). Tout groupe algébri- 
que connexe réduit G contient un sous- 
groupe affine connexe distingué H tel que 
le quotient G/H soit une variété abélienne. 

À une variété algébrique complète X on 
associe des variétés abéliennes intéressan- 
tes : la variété de Picard et la variété 
d'Albanese. La première a pour ensemble 
sous-jacent l’ensemble des classes pour 
l’équivalence linéaire de diviseurs algébri- 
quement équivalents à 0 sur X ; la seconde, 
A, est munie d’un morphisme X — ► A tel 
que tout morphisme de X dans une variété 
abélienne « se prolonge » à A d’une 
manière unique. Si X est une courbe, la 
variété de Picard et la variété d’Albanese 
coïncident, et portent le nom de jacobienne 
de X ; la dimension de la jacobienne est 
égale au genre de X. 

CHRISTIAN HOUZEL 
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GÉOMÉTRIE DIFFÉRENTIELLE 
CLASSIQUE 


L ? histoire des courbes planes est inti- 
mement liée à l’histoire et aux déve- 
loppements du calcul infinitésimal, et les 
premiers résultats obtenus au XVII e siècle 
sont directement issus de considérations 
géométriques et cinématiques. Les courbes 
dans l’espace à trois dimensions (dites à 
« double courbure ») ont été étudiées par 
Clairaut (173 1). C’est Monge qui, dans un 
mémoire présenté en 177 1, introduisit les 
notions fondamentales de rayon de cour- 
bure et de surface réglée développable 
engendrée par les tangentes à une courbe 
gauche. En 1826, Cauchy définit la nor- 
male principale et donna des expressions 
de la courbure et de la torsion. Enfin, 
Frénet ( 1847) et Serret (1850) démontrè- 
rent l’équivalent des formules qui portent 
leur nom. 

Les surfaces, pour leur part, ont été au 
XVIII e siècle une occasion naturelle de déve- 
lopper les fonctions de plusieurs variables. 
Euler, Monge admettent implicitement 
l’existence du plan tangent, qui est établie 
par Dupin en 18 13 et reprise par Cauchy 
(1826). L’étude de la courbure entreprise 
par Euler (1760), qui introduisit les direc- 
tions principales, a été approfondie par 


Meusnier (1776), Monge (1784) qui intro- 
duisit les lignes de courbure et Dupin 
( 18 13) qui introduisit les directions conju- 
guées et l’indicatrice qui porte son nom. 

La contribution fondamentale de Gauss 
(Disquisitiones circa superficies curvas , 
1827) donna un nouveau visage à la 
géométrie différentielle. Il utilisa une 
représentation paramétrique des surfaces 
(amorce de la notion de carte locale) et 
dégagea le caractère intrinsèque de la 
courbure totale ; tous les résultats du 
chapitre 6 lui sont dus. Enfin, le tournant 
décisif est dû à Riemann (Sur les hypothè- 
ses qui servent de fondement à lu géométrie, 
1854) qui surmonta les difficultés rencon- 
trées pour donner une définition globale 
mathématiquement satisfaisante des cour- 
bes et des surfaces en introduisant la 
notion de variété à n dimensions. 

On se bornera dans cet article à l’étude 
des courbes et surfaces plongées dans 
l’espace euclidien à deux ou trois dimen- 
sions. Les définitions correctes exigent 
l’emploi du théorème des fonctions impli- 
cites, c’est pourquoi on introduira d’abord 
ici la notion d’arc paramétré, dont l’image 
est une trajectoire, puis on effectuera 
l’étude locale ; la notion de courbe 
s’obtiendra ensuite en « recollant » de 
manière régulière une réunion de trajec- 
toires. On définira de même les surfaces en 
recollant entre elles des images de repré- 
sentations paramétriques régulières ; on 
introduira les deux formes fondamentales 
(l’ensemble de ces deux formes définit 
localement la surface à un déplacement 
euclidien près) et la courbure totale (qui ne 
dépend que de la première forme fonda- 
mentale). Cette courbure totale joue un 
grand rôle, tant dans l’étude locale (posi- 
tion par rapport au plan tangent) que 
globale (caractéristique d’Euler-Poincaré) 
des surfaces. 
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1. Sur quelques propriétés 
de l’espace euclidien 

La structure E 3 , d'espace euclidien de R 3 est 
définie par le choix du produit scalaire usuel 
pour lequel la base canonique Ej = ( 1 , 0 , 0 ), 
e 2 = (0, 1, 0), e 3 = (0, 0, 1) est orthonor- 
mée ; la norme de X = (x, y, z) est alors : 

x = Vx 2 +y* + z 2 . 

Un déplacement euclidien D est une appli- 
cation affine de R 3 dans R 3 telle que 
l’application linéaire associée soit une rota- 
tion, c’est-à-dire une transformation ortho- 
gonale de déterminant égal à 1 ; l’ensemble 
des déplacements euclidiens forme alors 
un groupe S, produit semi-direct du 
groupe additif R 3 (groupe des translations) 
et du groupe 0 + (3, R) des rotations. Un 
déplacement euclidien est défini par les 
trois composantes (a*, a 2 , a ’) de la trans- 
lation et les éléments a l j d’une matrice 
orthogonale de déterminant 1. On appelle 
mouvement euclidien une application t h-*- 
D, d’un intervalle I de R dans le groupe g ; 
ce mouvement sera dit différentiable de 
classe C* si les fonctions t a'(t) et / i — ► 
a'j(t) définissant ce mouvement sont des 
fonctions k fois continûment dérivables de 
t. Dans une interprétation cinématique, le 
paramètre t désigne le temps. Dans ce qui 
suit, nous adopterons le langage de la 
cinématique (vitesse, accélération) pour un 
paramétrage quelconque. 

Un repère ü (M, e { , e 2 , e 3 ) de l’espace 
euclidien E 3 est le transformé par un 
déplacement D du repère canonique (0, 
El, £ 2 > £ 3 ) î £ 3 ) est donc une base 

orthonormée de E 3 (considéré comme 
espace vectoriel) de même sens que (Ej, e 2 ? 
6 3 ), ce qui oriente l’espace. De plus, étant 


donné deux repères U et Ü', il existe un 
déplacement euclidien et un seul transfor- 
mant U en U', 

A un mouvement euclidien f « — ► cor- 

respond un repère mobile ü, = D, (T> 0 ) (on 
peut également définir un repère dépen- 
dant de plusieurs paramètres) défini par : 

M(t) = fl 1 (r)s 1 + a 2 (t)e 2 + a 3 (O e 3 
e,(0 = + af(t)e 2 + a?(t)s, 


pour i = 1, 2, 3 ; si on rapporte les 
vecteurs dérivés dM/dt et dejdt au repère 
mobile, on a, en utilisant le fait que 
d (e, ej)jdt = 0 : 

dU 


dt 


= + a 2 e 2 + a 3 e 3 

de ! 

W~ re 2 ~qe» 


de 


dt 

de- 

~dt 


1 = —re 1 +pe 3 , 


= qe,—pe 1 . 


Le vecteur a) de composantes (p, q, r) 
est le vecteur rotation instantanée du mou- 
vement ; pour tout vecteur Y lié à ü t , 
c’est-à-dire tel que : 

V = ne, + be 2 + ce } , 

où a, b, c sont des constantes, on a alors : 


On démontre que toute application 
continue d’une partie de E 3 dans E 3 , qui 
est une isométrie (c’est-à-dire conserve la 
norme), est une restriction de déplacement 
euclidien ou d’antidéplacement (transfor- 
mation affine dont la transformation 
linéaire associée est orthogonale de déter- 
minant 1 ). 

Rappelons enfin (cf. calcul infinitési- 
mal Calcul à plusieurs variables) qu’une 
applicationfd’un ouvert U de R P dans R 3 
est dite différentiable de classe c k si / 
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s’exprime au moyen de trois fonctions 
numériques. / = (f\ / 2 , / 3 ), admettant 
des dérivées partielles continues jusqu’à 
l’ordre k. La différentielle D f(a) de / au 
point a = (a’, a 2 , . . . . ü p ) E U est l’applica- 
tion linéaire de R'’ dans R 3 définie par : 

m°) -h = £ («)»', 

fri 

pour h = (h 1 , . . . . /^) (E R ;; ; on considérera 
souvent la forme quadratique associée à la 
différentielle seconde en a, définie par : 

p 

on appelle application affine tangente en a 
à / l’application affine T,/ définie par : 

ce qui équivaut à : 

/( fl + ^ ) — T fl /(A ) + E (Zi ) Il A || , 

où e(/î) tend vers 0 quand /z tend vers 0. 

Rappelons enfin que, si on compose 
deux applications différentielles g et/, on a : 

D(fog)(b) = Vf(g(a))oDg(b) 

et 

T*(/og) = T g (i)/ o ; 

en particulier, si Dg(b) (et par suite T/^g) est 
une bijection, alors T h (f o g) et T^/ont la 
même image. Dans le cas particulier où g 
est une fonction d’une variable, alors on a : 

^^(ï 0 ) = D/fe(f 0 )).^(/ 0 ). 


2. Remarques sur les courbes 
et les surfaces 

On a une notion intuitive de « courbe » 
dans l’espace euclidien à 2 ou 3 dimen- 


sions : une courbe de E 2 est définie par une 
équation F(x, y) = 0, ou y =f(x) ; une 
courbe de E 3 , est définie par deux équa- 
tions z = g(x) et y = f(x), o u 
F(x, y, z) ™ 0 et G(x, y\ z) - 0. De même, 
une « surface » de E 3 est définie par une 
équation z = / (x, y), ou F (x, y, z) = 0. 

Mais, si on veut préciser ces notions, 
des difficultés surgissent. Par exemple, le 
cercle de centre 0 et de rayon R est 
l’ensemble des points de E 2 dont les 
coordonnées vérifient l’équation : 

*2 + yi= R2, 

mais on peut aussi représenter ce cercle 
par : 

f x = R cos t 

1 y = R sin/, 0 <27 t; 

or l’application ainsi définie de l’intervalle 
fermé [0, 2 tt] sur le cercle n’est pas 
biunivoque, car les extrémités de cet inter- 
valle sont appliquées sur le même point A 
(1, 0) du cercle. Or, ce point ne présente 
aucune singularité sur le cercle. 

De même, la sphère de centre 0 et de 
rayon R est l’ensemble des points de E 3 
dont les coordonnées vérifient : 

x 2 + y 1 + z 2 = R 2 ; 

mais elle peut aussi être représentée par : 

' x = R cos u cos t 
- y = R cos u sin t 
. z = R sin u 

pour 0 $5 t ^ 2îT et 7T/2 ^ U ^ 7T/2, les 
courbes u = constante étant les parallèles et 
les courbes t = constante étant les méri- 
diens Mais l’application ainsi définie d’un 
rectangle de E? sur la sphère n’est pas 
biunivoque : les « pôles » P (0, 0, 1) et 
P’ (0, 0, — 1) correspondent respective- 
ment à u = 7r/2 et u = ir/2, t quelcon- 

que ; pourtant les points P et P’ ne présen- 
tent aucune singularité sur la sphère. 
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Par contre, le cône de révolution d’axe 
Oz d’équation : 

x 2 +y *— Z 2 = 0 , z ^ 0 

est en correspondance bijective avec le 
plan d’équation z = 0 , cette correspon- 
dance associant au point m (x, y) le point 
M(x, y, z) tel que : 

z = V * 2 + j > 2 ; 

pourtant ce cône présente un point singu- 
lier qui est son sommet. 


3. Arcs paramétrés et trajectoires 

Nous allons distinguer à présent les 
notions d’arc paramétré et de courbe 
régulière. 

On appellera arcparamétré de classe C* 
une applicationfd’un intervalle 1 = [a, b] 
de R dans E 2 ou E 3 qui soit k fois 
continûment dérivable dans 1 (en a et b , on 
considère respectivement les dérivées à 
droite et à gauche) ; dans ce qui suit, on 
supposera k assez grand pour que toutes 
les dérivations effectuées aient un sens. On 
appelle trajectoire de l’arc paramétré / le 
sous-ensemble image A =/( I). 

On dira que deux arcs paramétrés (/, I) 
et (g, J) de classe C* sont C k -équivalents s’il 
existe un Codifie o morphisme cp de I sur J 
(c’est-à-dire une bijection k fois continû- 
ment dérivable ainsi que son inverse) tel 
que : 

f = s °<p; 

cela entraîne en particulier que les deux 
arcs ont la même trajectoire. On dira que 
le changement de loi de « temps » T = <p(/) 
est un changement de paramètre admissi- 
ble. Pour tout t G 1, on a d(pjdt 0 ; les 
paramètres admissibles se répartissent 
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donc en deux classes : ceux pour lesquels 
d(Ç)/dt > 0 et ceux pour lesquels 
dyjdt < 0. Choisir un signe revient à 
orienter la trajectoire. 

Exemples 

Considérons le « trèfle à quatre feuilles » : 

x = cos / (cos 2 1 — sin 2 /) — cos t cos 2 / 
y = sinf (cos 2 1 — sin 2 t) = sin t cos 2 1 

pour 0 ^ t ^ 2 7 T ; l’origine 0 est un point 
multiple pour la trajectoire, car on a 
x = y = 0 pour t = tt/ 4, 3 ir/4, 5 tt/ 4, 
7 7T/4 (fig. 1). 


fig. 1 
V 



Le « trèfle à quatre feuilles » 

j x cos t cos 2t 
I y sin t cos 2t 

d'équation cartésienne 

(x 2 + y 2 ) 3 — (x 2 - y 2 ) 3 - 0 

Soit maintenant, pour t G R, l’arc para- 
métré : 

X = R(t — sin t ), 
y = R(1 — cos /) ; 

la trajectoire est composée d’arcs se dédui- 
sant les uns des autres par translation. 
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C’est la cycloïde , trajectoire d’un point lié 
à un cercle qui roule sans glisser sur une 
droite (fig. 2). 



Poipts réguliers 

l/ïïP^A n arc P¥ 

y ilvOOv à l’instant l 


amétré. On appelle 

le vecteur dérivé : 


d l 

dt 


(t) 


: lim 

h-0 


f(*+ h) - f{t) 
h ’ 


si on change la loi de temps, î = cp(r) et 

£(t) =/(<p(t)), on a ; 




et les vecteurs (df/dt)(t) et ( dg/dx)(x ), par 
suite, sont colinéaires ou simultanément 
tous deux nuis. 

Si (dfjdt)(î) n’est pas nui et si t est un 
point intérieur à I, la droite portant le 
vecteur vitesse s’appelle la tangente en M 
à la trajectoire. Si 1 = [t/, h\, on dit que 
l’arc est fermé lorsque f (a) = J{b) ; remar- 
quons que, même si en tout point la dérivée 
est non nulle, la trajectoire peut ne pas 
avoir de tangente en f[a) (par exemple si 
x — cos t cos 2 /, y = sin t cos 2 t pour 
tt/4 < t ^ 3 k/4). 


Si î est intérieur à l’intervalle I et si 
f'(t) ■=£ 0, on dit que le point f (t) est un 
point régulier de la trajectoire ; cette pro- 
priété se conserve par changement de 
paramètre admissible. Il résulte alors du 
théorème des fonctions implicites (cf. 
CALCUL INFINITÉSIMAL Calcul à plusieurs 
variables) qu’il existe un intervalle I. C I 
contenant t tel que la restriction de fà I b 
soit injective : par exemple, tous les points 
du cercle x = R COS ?, V = R sin t sont des 
points réguliers et la restriction de f à 

]t — TT, t + 7r[ fl I 

est injective pour tout î. 

Pour un arc paramétré, le vecteur 
cPf/dt 2 représente l’accélération. Dans un 
changement de paramètre admissible, on 
a, pour g(T) = f (t) .* 

dT*-\dT) dtl+djldt' 

ainsi, si les vecteurs df/dt et cPf/dt 2 ne sont 
pas colinéaires, le vecteur (pg/dx “ appar- 
tient au plan engendré par ces vecteurs, 
appelé plan osculateur à la trajectoire au 
point f (t). 

En un point régulier, désignons par p le 
plus petit entier ^ 2 tel que le vecteur 
dPfjdf soit non nul et non colinéaire au 
vecteur vitesse df/dt : au voisinage d’un tel 
point, la trajectoire présente l’aspect indi- 
qué sur la figure 3 : le point est dit ordinaire 
si p est pair ; si p est impair, la trajectoire 
« traverse » la tangente au voisinage du 
point et on dit qu’il y a inflexion . Le cas où 
df/dt et cPf/dt 2 sont colinéaires se ramène 
au précédent, car on peut trouver, dans un 
intervalle Ij C I contenant L un change- 
ment de paramètre admissible tel que 
c Pg/dx 2 soit nul. 
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Points singuliers 

Soit maintenant t 0 une valeur du paramètre 
pour laquelle le vecteur vitesse est nul ; on 
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dit que le point / (/) est un point singulier. 
Soitp et q, p < q y les plus petits entiers tels 
que les vecteurs : 


dPf / . d*f, x 
dtr { ‘ o) 6t Â? ( ' o) 


soient tous deux non nuis et non colinéai- 
res. 

Pour p impair , posons T = (/ t$f ; on 
définit ainsi un changement de paramètre 
qui est un homéomorphisme, mais qui 
n’est pas admissible au sens ci-dessus, car 
la fonction réciproque T 1 ** t = f 0 -j- j l /P 
n’est pas dérivable pour r = 0. On a alors : 


*(p )- i^. 


( 4 ), 


et, par suite, l’arc paramétré défini par 
l’application g est régulier pour j = 0 et il 
a la même trajectoire que l’arc défini par 
f On peut dire qu’on a une singularité 
« cinématique », due au paramétrage, et 
non une singularité de la trajectoire. Par 
exemple, l’arc paramétré défini par x — f 3 , 
y = fi, Z = t 9 a une singularité pour t — 0, 
mais, si on pose T = ? 3 , on obtient x = T, 
y — r 2 , z = T 3 , qui est un arc paramétré 
sans singularité. 

Si p est pair, on ne peut pas éliminer la 
singularité par changement de paramètre. 
On dit que la trajectoire présente un point 
de rebroussement. Au voisinage d’un tel 
point, la courbe présente l’aspect indiqué 
par la figure 4 ; si q est impair, on dit qu’on 
a un point de rebroussement de première 
espèce (cf. la cycloïde, fig. 2) ; si q est pair, 
on dit qu’on a un point de rebroussement 
de deuxième espèce. 

Élément de longueur 

Jusqu’à présent, nous n’avons pas utilisé la 
structure euclidienne de l’espace ; nous 
allons en faire usage pour choisir un 
paramètre admissible privilégié au voisi- 
nage d’un point régulier. On appelle abs- 
cisse curviligne un paramètres tel que, pour 
g(s) = f(t ), le vecteur vitesse dg/ds soit 
unitaire. Comme : 

(l)'-(f )‘(l)’ 


on doit avoir 


(^ s V _ (dfY _ ( dx V (dy \ 2 (d z Y 
\dt J Idt ) \ dt J \dt ) \ dt J ’ 


d’où 


’-’-iMftMSMD* 
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choisir le signe de s % c’est orienter la 
trajectoire en choisissant un « sens de 
parcours ». 

Si / définit un arc paramétré, l’inté- 
grale : 



finie t 0 = a < /, < t 2 < < t n , < t n 
“ h de l’intervalle [tf, h], associons la 
longueur de la ligne polygonale joignant les 
points /(?,) : 

1/(0 -/(»<-,) II; 

alors la longueur L est la borne supérieure 
de ces nombres pour toutes les subdivi- 
sions finies de [a, h]. 

Par exemple, la longueur du cercle de 
rayon R est : 



/sin 2 f + cos 2 1 dt = R dt = 2ttR, 


Pour la cycloïde, la longueur d’un arc 
compris entre deux points de rebrousse- 
ment successifs est : 


s(2ir)— 5(0) = J 2 " 2R sin ^ <a!t = 8 R. 


Trièdre de Fténet 

Nous allons continuer l’étude locale d’un 
arc paramétré nu voisinage d’un point 
régulier en associant à chaque point de la 
trajectoire un trièdre orthonormé de sens 
direct. 

Si on prend pour paramètre au voisi- 
nage d’un point régulier l’abscisse curvili- 
gne s , alors, par définition, le vecteur 
vitesse : 



est unitaire. Si le vecteur dt/ds n’est pas 
nul, il est orthogonal au vecteur t ; on 
posera : 


s’appelle la longueur de l’arc A ^ f ([a, b]). 
Cette longueur est invariante par change- 
ment de paramètre admissible et peut 
s’interpréter ainsi : à chaque subdivision 


dt_ _ n 
ds ~ R’ 

où n est un vecteur unitaire et R un nombre 
positif appelé rayon de courbure si la 
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courbe est non plane (dans le cas d’une 
courbe plane, on choisit le vecteur n 
directement perpendiculaire et R est un 
nombre réel de signe quelconque) ; on 
appelle alors centre de courbure le point P 
défini par P = M + Rn. Remarquons que 
si on change l’orientation de la trajectoire, 
5 1- *— s et t ' - — t, le vecteur dt/ds ne 
change pas d’orientation. Définissons 
alors le vecteur b par la formule : 

b = t A n ; 

le trièdre t , n, b s’appelle le trièdre de 
Frénet. On a les formules : 

dt n 
ds R 

dn _ t b 
ds = — R + T’ 
db n , 

ds T’ 

les fonctions 1/R(j) et 1/T(^) s’appellent 
respectivement la courbure et la torsion de 
la trajectoire. Au voisinage d’un point 
régulier, les projections de la trajectoire sur 
les trois plans définis par t , n, b présentent 
l’aspect indiqué par la figure 5. 

On démontre que si deux trajectoires 
ont même courbure et même torsion pour 
tout s , alors il existe un déplacement 
euclidien transformant l’une en l’autre. Si 
1 /T = 0 pour tout 5 , la trajectoire est 
plane ; si 1/R = 0, alors la torsion est nulle 
et la trajectoire est une droite. 


4. Courbes régulières 

Nous sommes enfin capables de donner 
une définition correcte de la notion de 
courbe régulière. 

Par définition, une courbe régulière C, 
de classe C*, de l’espace euclidien E 3 ou E? 
est un sous-ensemble qui possède la pro- 


fig. 5 


t 



n 



b 



rojections d'une courbe sur les trois plans du trièdre 
e Frénet 

priété suivante : Tout point J E C est 
centre d’une boule ouverte B (resp. d’un 
disque ouvert B) telle qu’il existe un arc 
paramétréf: 1 — * E 3 (ou E 2 ), de classe C*, 
tel que f(t) ^ 0 pour tout ? E I, qui soit 
un homéomorphisme de 1 sur C fl B. Ainsi 
C est une réunion de trajectoires d’arc 
paramétrés sans points singuliers. Si (f h I,) 
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et (fp 1,) sont deux représentations para- 
métriques telles que I i} — f(lj) H fflf ne 
soit pas vide, alors, ff ] of i9 défini dans 
f _1 (Iÿ), est un changement de paramètre 
admissible. Ce qui précède sur les arcs 
paramétrés montre qu’on peut définir la 
tangente en chaque point ainsi que, quand 
le plan osculateur est défini, le trièdre de 
Frénet. Remarquons qu’une courbe aussi 
simple que la cycloïde ne rentre cependant 
pas dans ce cadre, car elle présente des 
points singuliers. 

Le théorème des fonctions impli- 
cites entraîne que si F est une fonction 
numérique sur E 2 , différentiable de déri- 
vée ne s’annulant pas sur F -1 (a) pour un 
nombre réel a , l’ensemble F -1 (a) est une 
courbe régulière ; de même, dans E 3 , 
si deux fonctions Fj et F 2 sont indépen- 
dantes, l’ensemble défini par F] = cons- 
tante et F 2 = constante est une courbe 
régulière. Par exemple, dans le plan, 
l’équation : 

(* l +y z y — (x 2 —y 2 ) 2 = a 

représente une courbe régulière pour a 7^ 
0, car la différentielle de F(x, y) = (x 2 + 
y' 2 ) 3 — (x 2 — y 2 ) 2 ne s’annule que pour 
X = y = 0, et alors F(0, 0) = 0. Par 
contre, l’équation (x 2 + } ?2 ) 3 — (x 2 — y’)’ 
= 0 représente une courbe présentant une 
singularité à l’origine : c’est le « trèfle à 
quatre feuilles » vu ci-dessus (fig. 1). 

Enfin, une courbe régulière est dite 
orientée si tous les changements de repré- 
sentation paramétrique fj~ 1 0 f sont des 
fonctions croissantes. 

On peut démontrer pour les courbes 
fermées régulières planes les deux théorè- 
mes suivants : l’angle dont «tourne » le 
vecteur unitaire tangent à une telle courbe 
orientée est ± 2?T ; pour toute courbe 
fermée convexe (c’est-à-dire ne présentant 
pas d’inflexion, et par suite pour laquelle 


la courbure garde un signe constant) il y 
a au moins quatre sommets (c’est-à-dire 
des points où la courbure présente un 
extrémum). 


5. Définition des surfaces 
Surfaces régulières 

On appellera surface régulière de classe C A ’, 
k ^ 1, de l’espace euclidien E 3 un SOUS- 
ensemble S C E 3 possédant la propriété 
suivante : Tout point de S est centre d’une 
boule ouverte B de E 3 telle qu’il existe une 
application cp de classe C* d’un ouvert U 
de R 2 dans E 3 : 

(m, v) ► <p(w, v) 

de rang 2 en tout point de U, qui soit un 
homéomorphisme de U sur S D B. Si 
cp = (cpj, cp?, cp 3 ), où cpj, cp 2 et cp 3 sont des 
fonctions numériques de classe C*, la 
condition sur le rang signifie que la 
matrice : 

( d<Pi dqpz dqp 3 \ 
du du du I 
d cpi à(ç 2 d<p 3 J 
âv dv dv J 

est de rang 2, ou encore que le produit 
vectoriel : 

d<p a<p 

du dv 

est un vecteur non nul. 

L’application cp est appelée une repré- 
sentation parumétrique vraie , ou régulière , 
de Y = S H B. Il résulte alors du théorème 
des fonctions implicites qu’au voisinage de 
chaque point de S on peut exprimer l’une 
des coordonnées comme fonction de 
classe C k des deux autres, l’application 
ainsi définie étant de rang 2. Si (cp,-, U,) et 
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fig. C 



• hangement de paramètre pour une surface s 


(cpy, U,) sont deux représentations para- 
métriques telles que V ;/ = cp^U,-) D cp^Uy) 
ne soit pas vide, le changement de para- 
mètre cpy 1 o <p, est un difféomorphisme de 
classe C* de <P/ _1 (V ÿ ) sur cp y 1 ( Vÿ) (fig- 6)- 
Ces considérations conduisent directe- 
ment à la notion de variété différentiable 
générale. 

Par exemple, pour la sphère S de centre 
0 et de rayon 1, la représentation para- 
métrique : 

’ x = COS u cos Y 
■ y = COS u sin Y 
. z = sin u 

n’est pas régulière aux pôles. Par contre, 
au moyen d’une projection stéréographi- 
que de pôle (P(0, 0, 1), on définit une 
application de classe C k de R 2 sur 
s - {PJ : 

= 2u 

* 1 + « 2 + v 2 ’ 

2 v 

y = 1 + u 2 + v 1 ’ 

_ u 2 + v 2 — 1 

1 + m 2 + v 2 ’ 


qui est un homéomorphisme. De même, 
l’inversion de pôle P'(0, 0, 1) applique 

R 2 sur S - {P’} : 

2 u 

X = y + u '2 + v' 2 ’ 

2 Y 

y ~ 1 + tt' 2 + v' 2 ’ 
w' 2 +v' 2 — 1 

2 = 1 + u’ 2 + V 72 ’ 

dans R 2 ™ {O}, le changement de para- 
mètre est l’inversion de pôle 0 et de 
puissance 1 : 

, u , v 

u — — — — , V — 

U 2 + V 2 U 2 + V 2 

En utilisant le fait que S est compacte 
(fermée et bornée dans R 3 ), on peut 
montrer qu’il n’existe aucune représenta- 
tion paramétrique régulière de la sphère 
tout entière. 

De manière générale, soit f une fonc- 
tion numérique de classe C k définie dans 
E 3 ; si a G /(E 3 ) est tel quef soit de rang 
1 (c’est-a-dire que sa différentielle ne 
s’annule pas) en tout point de f’(n), alors 
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le théorème des fonctions implicites 
entraîne que l’ensemble f~\ü) est une 
surface régulière. Par exemple, la sphère 
est définie par l’équation : 

x 2 +y 2 + z 2 = 1 

S’il existe des points de où la 

différentielle s’annule, on dit que f~ [ (a) est 
une surface avec singularités ; par exemple 
le cône x 2 -f- y 1 z 2 = 0, vu au chapitre 2, 
a l’origine pour point singulier (sommet du 
cône). 

Comme exemples importants de surfa- 
ces régulières, on a notamment les quadri- 
ques (à l’exclusion du cône) définies par 
une équation : 

f(x,y> z) = constante 

où f est un polynôme de degré 2 (cf. 
quadriques) , par exemple l’hyperboloïde à 
une nappe : 



il admet la représentation paramétri- 
que : 

x = a cos u ch v 
y = b sin w ch y 
z = c ch v 

qui n’est pas régulière, car non bijec- 
tive. Par contre, cette représentation 
paramétrique définit un difféomorphisme 
de S, X R sur la surface, en désignant 
par S, le cercle de centre 0 et de rayon 1. 
Un autre exemple est le paraboloïde 
hyperbolique (« selle de cheval ») d’équa- 
tion : 



qui est difféomorphe à R 2 (fig. 10). 

On dit qu’une surface S est réglée si par 
tout point de S passe au moins une droite 


entièrement contenue dans S ; une telle 
droite est appelée une génératrice de la 
surface (fig. 7 et 8) Par exemple, l’hyper- 



fig. 7 - La ci 
= 0 (D. R.). 


boloïde à une nappe et le paraboloïde 
hyperbolique sont engendrés par deux 
familles à un paramètre de droites : par 
chaque point passe une génératrice de 
chaque famille. 

Parmi les autres surfaces d’un type 
particulier, notons les surfaces de révo- 
lution : une surface S (régulière ou 
avec singularités) est dite de révolution 
autour d’un axe D si toute rotation d’axe 
D transforme S en elle-même. Ainsi, si M 
est un point de S qui n’appartient pas à D, 
le cercle d’axe D passant par M est 
entièrement situé dans S ; on dit qu’un 
tel cercle est un parallèle de la surface. 
De même, on appelle méridien les 
intersections de S avec les plans passant 
par D ; bien entendu, la terminologie 
précédente généralise celle adoptée tradi- 
tionnellement pour la sphère qui est de 
révolution autour de tout axe passant par 
son centre. Par exemple, pour a = b, 
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fig. 8 - Une surface réglée du quatrième degré (M. Tristant). 


I’hyperboloïde à une nappe est de révo- 
lution autour de l’axe O Z ; c’est la surface 
engendrée par la rotation d’une droite 
autour d’un axe non coplanaire et les 
méridiens sont des hyperboles. Le tore est 
défini par la rotation d’un cercle autour 
d’une droite de son plan ne le rencontrant 
pas (fig. 11). Il admet la représentation 


paramétrique (non régulière, parce que 
non bijective) : 

’ x = (2 + cos u ) cos v 
■ y — (2 + cos u ) sin v 
„ z = sin u ; 

cette représentation paramétrique définit 
un difféomorphisme de Sj X S j sur le tore, 
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en désignant toujours par Si le cercle de 
rayon 1. 


Plan tangent 

Soit M un point d’une surface régulière (ou 
un point régulier d’une surface avec sin- 
gularités). Si (cp, U) est une représentation 
paramétrique régulière au voisinage de M, 
l’image de R 2 par l’application affine 
T M cp tangente à cp au point m = <p _1 (M) 
(cf. chap. 1) est indépendante du choix de 
la représentation paramétrique régulière : 
cette image est le plan, passant par M, 
engendré par les vecteurs : 


_ (m) 


appelé plan tangent à la surface en M. On 
le désignera par T M S. Ce plan tangent est 
l’ensemble engendré par les tangentes en 
M aux courbes régulières passant par ce 
point et tracées sur S. De manière précise, 
cela signifie que, pour tout arc paramétré 
régulier y tel que y(ù)) = M dont la 
trajectoire est contenue dans S, le vecteur 
vitesse (d^jdî)(t^) d’origine M appartient 
au plan tangent; de plus, si cp : U — ► S, 
U C R 2 est une représentation paramétri- 
que de S, l’application y se factorise 
localement sous la forme y = cp o /, où f 
est un arc paramétré de U, c’est-à-dire que 
l’arc paramétré est défini par u = f\{t), 
v — f 2 (t) si f = (/|, f 2 ). En particulier les 
vecteurs (d(p/du)(m) et (dcp/dv)(m) corres- 
pondent respectivement à y — constante et 
u = constante. Réciproquement ; pour tout 
vecteur V E T M S, il existe une application 
f '• I— ► U telle que le vecteur vitesse : 

d(yof) 

~~dT~ {to) 

soit égal au vecteur V. 

Si la surface est réglée, toute génératrice 
passant par M appartient au plan tangent ; 


en particulier, s’il passe par M deux géné- 
ratrices distinctes, elles engendrent le plan 
tangent : c’est ce qui se produit pour 
l’hyperboloïde à une nappe et pour le para- 
boloïde hyperbolique (fig. 10). Dans le cas 
particulier où le plan tangent est le même 
tout le long de chaque génératrice, on dit 
qu’on a une surface réglée développable. 

Examinons les différentes surfaces 
réglées développables. Si toutes les géné- 
ratrices passent par un point fixe, on a un 
cône ; si elles sont parallèles à une direction 
fixe, on a un cylindre. Un autre exemple 
très important s’obtient à partir des tan- 
gentes à une courbe : l’ensemble des 
tangentes à une courbe régulière engendre 
une surface développable. On peut mon- 
trer que la surface développable la plus 
générale est formée de nappes de surfaces 
coniques, cylindriques et de tangentes à 
des courbes gauches, ces nappes étant 
attachées les unes aux autres le long d’une 
génératrice (deux nappes se « recollant » le 
long d’une génératrice ont même plan 
tangent). 

Position par rapport au plan tangent 

Au voisinage d’un point M 0 (x 0 , V’o> z o) 
régulier d’une surface S, on peut exprimer 
une des coordonnées en fonction des deux 
autres, par exemple z = g{x , y). Le plan 
tangent en M 0 est alors défini par : 

Z ~’ Z ° = ff (™o)(*— *o) + ^("*o)0— ?o). 

OÙ ra 0 est le point (x 0 , >’q) ; par un 
changement de repère euclidien, on peut 
ramener M 0 à l’origine des coordonnées, 
soit Xq = Jq = Zq = 0, le plan tangent en 
ce point à S étant défini par z = 0, soit 
(ôgjdx)(m ü ) = 0 et (ôg/ôy)(m Q ) = 0. Le 
nombre z = g(x, y) représente alors la 
distance « algébrique » du point M (.Y, }\ 
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g(,Y, y)) de la surface au plan tangent en 
M 0 . La formule de Taylor donne : 

Z = g(x,y) = rx 2 + 2sxy + ty 2 + R,, 


où on a adopté les notations de Monge : 




le reste est ici une quantité qui tend vers 
0 plus vite que A' 2 + >’ 2 quand (.y, >’) tend 
vers (0, 0). 

Si la forme quadratique associée à la 
différentielle seconde de g : 


Q(*,y) = rx 2 + 2sxy + ty 2 


est nulle (r = s = î — 0), on dit que le 
point M 0 est pbt ; la surface et son plan 
tangent ont alors un contact d’ordre supé- 
rieur à 1. Par exemple, la surface d’équa- 
tion z = .Y 3 — 3 A y 2 (« selle de singe ») a un 
point plat à l’origine ; elle coupe son plan 
tangent à l’origine suivant trois droites et 
traverse ce plan tangent (fig. 9). Par contre, 
la surface r = X 2 y 2 , qui présente elle aussi 
un point plat à l’origine, coupe le plan 
tangent en ce point suivant deux droites et 
reste d’un même côté de ce plan tangent 
(fig- 9). 

Si la forme quadratique Q est non nulle, 
on distingue trois cas (fig. 10) : 

a) Si rt — s 2 > 0, la forme Q est définie 
positive ou négative. Au voisinage de M 0 , 
l’intersection de S et du plan tangent en M 0 
se réduit a M 0 et la surface reste d’un 
même côté de ce plan tangent (elle est 
localement convexe). C’est le cas de tous 
les points d’un ellipsoïde. On dit que le 
point M 0 est elliptique. 

b) Si rt s 2 < 0, la surface traverse 

son plan tangent au voisinage de M,. 
C’est le cas de tout point d’un hyperbo- 
loïde à une nappe ou d’un paraboloïde 
hyperbolique. On dit que le point est 
hyperbolique. 
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c) Si rt s 2 = 0, on ne peut rien dire 
de général. Même si la surface reste 
localement d’un même côté du plan tan- 
gent (point parabolique ), l’intersection ne 
se réduit pas nécessairement à un point. 
C’est le cas de tout point d’un cylindre 
elliptique ou parabolique ; l’intersection 
avec un plan tangent est ici une généra- 
trice. 

Une même surface peut présenter des 
points de nature différente. Par exemple, le 
tore, dont on a donné une représentation 
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paramétrique ci-dessus, admet des points 
elliptiques (tels que x 2 + y 2 > 1), des 
points hyperboliques (tels que 
X 2 + y 2 < 1 ; fig- 11) et des points para- 
boliques (tels que X 2 + y 2 = 1). L’ensem- 
ble des points paraboliques est constitué de 
deux parallèles au tore, le plus « haut » et 
le plus « bas », et en un tel point de plan 
tangent touche le tore tout le long du 
parallèle correspondant. 



6. Formes fondamentales 
sur une surface 

On appelle première forme fondamen- 
tale sur une surface S la forme quadrati- 
que <ï> qui, à tout vecteur V tangent à S 
en M. associe le carré de sa longueur, 
soit : 

4>(V) = ||V||î = V.V, V€T m S. 
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Si au voisinage de M la surface S admet 
pour représentation paramétrique 

(u y V’) cp (U, v), on écrit : 

Dtp = du + dv, 
du dv 

et on a : 


se factorise sous la forme y = cp of (cf. 
infra) y alors le produit scalaire : 

«•g(/ 0 ) = »-D^(g ( r o)) g( <0 )), 

où D 2 cp est la dérivée seconde de cp, ne 
dépend que du vecteur tangent : 


<I> = Dcp . Dtp 

= E du 2 + 2 F du dv + G dv ■ 

en posant : 



e -(£î) 

F - ^E. 


*■- \du h 

du dv 

V dv ! 

justifions ces 

notations. Si 

y est un ; 


paramétré, dont le vecteur vitesse en M est 


v = ï ( '° ) = D (’ 

en effet, on a : 

d 2 y dtp d 2 u dtp d 2 v 
dt du dt 2 + dv dt 2 

d 2 tp / du \ 2 d 2 tp du dv d 2 y(dv\ 2 

du 2 V dt ) dudv dt dt + d 2 v\dt ) 


égal à V, qui se factorise sous la forme 
y= cp o / (avec les notations du chapitre 
précédent), alors on a : 




d’où : 


ip(V) = n 


= C 




et par suite : 


en posant : 


-î>(V) = d <p(5(m)-d<p(J(^ 0 ))- 


Définissons maintenant la deuxième 
forme fondamentale ; il sera pour cela 
nécessaire d’orienter la surface. Si la repré- 
sentation paramétrique cp:U —►S, UC R 2 
est régulière en tout point M de <p(U), le 
produit vectoriel : 




où m = (p ‘(M) G U, est non nul ; on peut 
donc associer à chaque point M de cp(U) 
un vecteur unitaire n normal à S de même 
sens que le produit vectoriel précédent, 
c’est-à-dire on oriente la surface. Si un arc 
paramétré : 

y : I — S, I C R, 


C = n- 


d 2 cp 
du" 2 ’ 


d 2 <p 


d 2 <p 




La forme quadratique ip : V ip(V) est 
appelée la deuxième forme fondamentale 
de la surface. On démontre que la quan- 
tité : 


_ C«Af — X > 2 

K ~ EG — F 2 

est indépendante de la représentation para- 
métrique. En particulier, pour la représen- 
tation paramétrique z = g(x, y’) utilisée 
dans le chapitre précédent (avec 
p = q — 0 en M), on a : 

K = r/ — 5 2 ; 

ce scalaire K s’appelle la courbure totale, 
ou courbure de Gauss, en M. Suivant le 
signe de K, le point est elliptique, hyper- 
bolique ou parabolique (cf. chap. 5, Posi- 
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tion par rapport au plan tangent) ; remar- 
quons que, puisque la forme quadratique 
<J> est définie positive, le signe de K est celui 
de Ch” A 2 . 

C. Gauss a démontré que la courbure 
totale était déterminée par E, F, G et leurs 
dérivées partielles premières. Étant donné 
deux surfaces S et S’, on appelle isométrie 
locale de S dans S’ un difféomorphisme 
d’un ouvert U de E 3 dans E 3 , appliquant 
s n u dans S’ et transformant en chaque 
point M de S Pi U la première forme 
fondamentale de S en la première forme 
fondamentale de S’ ; par suite, une iso- 
métrie locale laisse invariante la courbure 
totale. En particulier, une surface S telle 
qu’il existe en chaque point M G S une 
isométrie d’un voisinage de ce point dans 
S sur un ouvert plan est dite applicable sur 
le plan ; puisque, pour un plan, la deu- 
xième forme fondamentale est nulle, la 
courbure totale d’une surface applicable 
sur un plan est nulle. On démontre que 
toute surface à courbure totale nulle est 
une surface développable et que toute 
surface développable est applicable sur le 
plan. 

Plus généralement, on montre que si 
deux surfaces S et S’ ont une courbure 
totale constante (cette constante étant la 
même pour les deux surfaces), il existe des 
isométries locales de S sur S\ Si la 
courbure totale est une constante positive, 
on dit que la surface est une surface 
sphérique ; parmi ces surfaces figurent la 
sphère, et les surfaces sphériques de révo- 
lution du type hyperbolique et du type 
elliptique (fig. 12). Si la courbure totale est 
constante négative, on a les surfaces pseu- 
dosphériques ; celles qui sont de révolution 
se répartissent en trois types indiqués par 
la figure 13. 

Enfin, signalons qu’on démontre 
qu’une isométrie locale qui conserve aussi 
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fig. 13 




type hyperbolique 


type elliptique 


type parabolique 
(pseudosphère) 


S'u/faces pseudosphériques de révolution 


la deuxième forme fondamentale est la 
restriction d’un déplacement euclidien ; 
par suite, l’ensemble des deux formes 
fondamentales caractérise localement une 
surface. 


7. Courbes tracées 
sur une surface 

Soit C une courbe régulière orientée tracée 
sur une surface régulière S ; à tout point M 
de C on va attacher un repère, appelé 
trièdre de Darboux , obtenu de la manière 
suivante : soit t , rt, b le trièdre de Frénet 
de la courbe C au point M ; le trièdre de 
Darboux C} s’obtient en prenant 

pour e 3 le vecteur unitaire normal en M à 
la surface associé à l’orientation de cette 
surface, et en prenant = t (et 
(?2 = £3 A é'i pour obtenir un trièdre 


direct). Si s est l’abscisse curviligne sur C, 
on a alors les formules : 


dei 
ds 
de 7 _ 
ds 

de 3 _ 
ds 



~ e 3> 

Pn 


+ 



les nombres 1/p^, l/p fJ et l/r g ainsi définis 
s’appellent respectivement la courbure 
géodésique , la courbure normale et la 
torsion géodésique en M. Si p et t sont la 
courbure et la torsion de C en M, on a, en 
désignant par 0 l’angle des deux vecteurs 
n et e 3 : 

1 _ sin 0 1 _cos0 1 de 1 
^ = —’ r g =dI + T’ 

La courbure normale \/p n en M est la 
même pour toutes les courbes tracées sur 
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S qui admettent la même tangente en ce 
point M ; en effet, l/p„ = e 3 . (c fM/ds 2 ), ce 
qui entraîne que cette courbure normale 
est égale à tp(^i), en désignant par ip la 
deuxième forme fondamentale. On en 
déduit le théorème de Meusnier : Si un plan 
P pivote autour d’une droite du plan 
tangent T M S, alors le centre de courbure 
(en M) de la section de S par P décrit un 
cercle passant par le point M. Un point 
d’une surface S pour lequel la courbure 
normale est la même dans toutes les 
directions est appelé un ombilic. 

Une courbe tracée sur S est appelée 
une ligne asymptotique si la courbure 
normale en chacun de ses points est nulle ; 
en chaque point, tout vecteur tangent 
à une telle courbe annule la deuxième 
forme fondamentale. Par suite, il ne passe 
de lignes asymptotiques que par les 
points hyperboliques (deux directions 
asymptotiques) ou paraboliques (une 
direction asymptotique). Toute droite tra- 
cée sur une surface est une ligne asymp- 
totique. 

On appelle lignes de courbure les lignes 
dont la torsion géodésique en chaque point 
est nulle, et on montre que cette condition 
équivaut à dire que les normales à la 
surface S le long d’une telle courbe engen- 
drent une surface développable ; ces nor- 
males sont les tangentes à la courbe décrite 
par les centres de courbure de la ligne de 
courbure. En chaque point régulier qui 
n’est pas un ombilic, il existe deux direc- 
tions du plan tangent, appelées directions 
principales, perpendiculaires entre elles, 
pour lesquelles la courbure normale atteint 
son maximum l/Ri et son minimum l/R? ; 
les lignes de courbure peuvent aussi être 
définies comme les courbes tangentes en 
chaque point aux directions principales 
(fig. 14). La courbure totale est reliée 


fig 14 



Surfaces des centres S, et S 2 dSSOClées aux deux 
lignes de courbure d’une surface Sa” voisinage 
d’un point régulier qui n’est pas un ombilic. 

simplement aux courbures des lignes de 
courbure par la formule : 

K-—- 

R,R 2 

Sur une surface dont tous les points 
sont des ombilics, toutes les courbes sont 
lignes de courbure ; les seules surfaces 
possédant cette propriété sont les plans (K 
= 0) et les sphères (K = 1/R 2 constant). 

On appelle géodésiques les courbes dont 
la courbure géodésique est nulle, c’est-à- 
dire dont la normale principale est nor- 
male à la surface ; les géodésiques sont 
définies par un système d’équations diffé- 
rentielles du second ordre, et on démontre 
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que par tout point d’une surface il passe 
une géodésique et une seule admettant une 
tangente donnée. De même, par deux 
points M et M’ de S assez voisins passe une 
géodésique et une seule : la longueur de 
l’arc de géodésique MM’ réalise alors le 
minimum de la longueur des arcs joignant 
M à M’. Par exemple, les géodésiques du 
plan sont les droites ; les géodésiques d’une 
sphère sont les grands cercles, sections de 
la sphère par les plans passant par le 
centre, et par deux points non diamétra- 
lement opposés passe un tel grand cercle et 
un seul. Les géodésiques d’un cylindre de 
révolution sont les parallèles et les hélices 
circulaires. 

On montre que la courbure géodésique 
ne dépend que de la première forme 
fondamentale ; par suite, une isométrie 
locale applique les géodésiques sur les 
géodésiques. 


8. Propriétés globales 
liées à la courbure totale 

Soit y : I —► S un arc paramétré d’une 
surface S. Si X = X(t) est un champ de 
vecteurs le long de la courbe C = y(I), on 
définit la dérivée covariante DX/dt du 
champ X au point M = y(/) en projetant 
le vecteur dX/dt sur le plan tangent T M S 
parallèlement à la normale. On dit alors 
que le champ X se déplace par parallélisme, 
ou est parallèle, si pour tout t G 1 la dérivée 
covariante est nulle. Remarquons que la 
valeur X(/ 0 ) du champ en un point déter- 
mine alors le champ parallèle. En particu- 
lier, on dit qu’un arc paramétré est géo- 
désique si sa vitesse se déplace par 
parallélisme ; une courbe géodésique 
devient un arc géodésique si on prend pour 
paramètre l’abscisse curviligne S ou tout 


autre paramètre t = 3 S + b, 3 et b cons- 
tants avec a 9 ^ 0. 

Si la courbure totale n’est pas nulle, le 
transport par parallélisme le long d’un 
lacet (c’est-à-dire un arc paramétré y : 
[a, b] — S tel que y (a) = y(b) ne ramène 
pas en général le vecteur X(tf) à sa position 
initiale et, par suite, si on considère deux 
points M et M’, le transport par parallé- 
lisme de M à M’ dépend du chemin choisi. 
En effet, on démontre que la « variation de 
l’angle » du vecteur X par transport 
parallèle le long d’un lacet est l’intégrale : 



où Z est la partie de S limitée par le lacet 
et do l’élément d’aire sur S. 

D’autre part, on montre que si le lacet 
y se compose d’un nombre fini d’arcs 
différentiables y* séparés par des points 
anguleux où l’angle du vecteur tangent à 
y subit une discontinuité 8,. on a : 




d a 

R1R2’ 


formule de Gauss-Bonnet. Dans le cas 
particulier où y est un triangle géodésique, 

c’est-à-dire un triangle curviligne dont 
les côtés sont des arcs géodésiques, l’inté- 
grale de la torsion géodésique est nulle. 
Si on désigne par Oj, (X 2 > ^3 l es mesures 
en radian (comprises entre 0 et 2 7 r) des 
angles du triangle, on a, puisque ces angles 
sont les supplémentaires de ceux qui 
interviennent dans la formule de GaUSS- 
Bonnet : 


CX 1 4" CX 2 + CX3 — TT + 


d 0 

SS RiR-2* 


pour le plan on retrouve le résultat classi- 
que que la somme des angles d’un triangle 
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est égale à tt. Sur une sphère de rayon R, 
on a : 

A 

Otj + 0 2 + a 3 — ^ ’ 

K 2 

où A est l’aire du triangle. Remarquons 
que si la courbure totale est négative en 
tout point de S, alors la somme des angles 
d’un triangle géodésique est inférieure à 7L 
On retrouve que les surfaces à courbure 
constante constituent des modèles pour les 
géométries non euclidiennes de Riemann 
et de Lobatchewski. 

Si on considère maintenant une surface 
compacte (c’est-a-dire fermée et bornée) 
sans bord, on montre qu’on peut la trian- 
guler, c’est-à-dire la découper en domaines 
limités par des triangles curvilignes (pas 
nécessairement géodésiques). Appliquant 
la formule de Gauss-Bonnet à chaque 
triangle et faisant la somme, on obtient, 
puisque chaque arc est parcouru deux fois 
en sens contraires : 

JJ S srfe =2,r( " 2_ " ,+ " o) ' 

0 ù n->,n, et Hq sont respectivement le 
nombre de triangles, le nombre d’arêtes et 
le nombre de sommets de la triangulation. 
Le premier membre étant indépendant de 
la triangulation, il en est de même du 
second. Le nombre entier positif : 

n 2 — n l +« 0 

est appelé la caractéristique d’Euler- 
Poincaré de la surface ; par exemple, pour 
la sphère il est égal à 2, car : 



pour le tore, la caractéristique d’Euler- 
Poincaré est nulle. 

On montre que la caractéristique 
d’Euler-Poincaré est un invariant topolo- 


gique de la surface. On montre aussi qu’il 
existe, sur une surface S, un champ diffé- 
rentiable de vecteurs tangents ne s’annu- 
lant en aucun point si, et seulement si, la 
caractéristique d’ Euler-Poincaré est nulle ; 
il n’existe donc pas de tel champ sur une 
sphère. 

PAULETTE LIBERMANN 
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GROUPES 


L es idées de symétrie et de régularité se 
retrouvent dans toutes les civilisations, 
bien avant que ne fût conçue la notion de 
groupe : par exemple, presque tous les 
groupes discrets de déplacements du plan 
(il y en a dix- sept types non isomorphes) 
sont sous-jacents aux multiples ornements 
géométriques imaginés par les artistes 
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arabes. Les Grecs, dans leur géométrie, 
ont été très tôt intéressés par les propriétés 
de régularité, et on sait que le couronne- 
ment des Eléments d’Euclide est la cons- 
truction des cinq polyèdres réguliers, ce 
qui, en substance, revient à la détermina- 
tion des groupes finis de rotations dans 
l’espace à trois dimensions. 

Toutefois, la notion de groupe n’appa- 
raît explicitement qu’au cours des travaux 
sur la résolution des équations algébriques 
« par radicaux », au début du XIX e siècle ; 
développant une idée de Lagrange, Ruffini 
et Cauchy sont amenés à considérer les 
groupes de permutations des racines d’une 
équation algébrique qui laissent invarian- 
tes certaines fonctions de ces racines ; et 
c’est en approfondissant cette idée que 
Galois obtiendra ses résultats décisifs sur 
la résolution par radicaux. Ces premiers 
groupes sont donc des groupes finis , et 
c’est sous la forme de la théorie des 
groupes de permutations que la théorie 
générale des groupes finis commencera à 
se développer (notamment chez Mathieu 
et Jordan) jusque vers 1870. Les débuts de 
la cristallographie mathématique (vers 
1830) font apparaître d’autres groupes 
finis, cette fois formés de rotations et de 
symétries laissant un point fixe ; enfin, 
Jordan, en 1868, aborde franchement 
l’étude des groupes de déplacements (finis 
ou non) dans l’espace euclidien à trois 
dimensions. Un peu plus tard, Klein et 
Poincaré feront des groupes de déplace- 
ments non euclidiens le fondement de leur 
théorie des fonctions automorphes, tandis 
que Lie, cherchant à réaliser pour les 
équations différentielles ce que Galois 
avait fait pour les équations algébriques, 
crée la théorie générale des groupes conti- 
nus de transformations (actuellement 
appelés groupes de Lie). En même temps, 
Klein est amené, par ses réflexions sur les 


fondements de la géométrie « élémen- 
taire », à mettre la notion de groupe de 
transformations à la base même de cette 
branche des mathématiques, qui devient 
un simple chapitre de la théorie des grou- 
pes classiques développée depuis Jordan 
pendant toute la fin du XIX e siècle. 

Il faut attendre la fin du XIX e siècle pour 
que la structure de groupe telle que nous 
la concevons aujourd’hui soit enfin définie 
de façon intrinsèque (et non plus en se 
restreignant au cas où les éléments du 
groupe sont des transformations). Depuis 
lors, la notion de groupe a envahi toutes les 
mathématiques contemporaines. On s’est, 
d’une part, aperçu du caractère protéi- 
forme de l’idée de groupe, débordant 
largement le concept initial de groupe 
« ensembliste » (groupes topologiques, 
groupes algébriques, schémas en groupes 
et, plus généralement, « objets en grou- 
pes » d’une catégorie représentant un fonc- 
teur représentable de cette catégorie dans 
la catégorie des groupes) ; on a, en outre, 
découvert de surprenantes relations entre 
des types de groupes très divers (par 
exemple entre les groupes de Lie, les 
groupes algébriques, les groupes « arith- 
métiques » et les groupes finis). D’autre 
part, l’expérience a montré l’extraordi- 
naire efficacité de la notion de groupe dans 
toutes les parties des mathématiques, une 
fois qu’on parvient à l’y introduire : 
groupes d’homologie et d’homotopie en 
topologie algébrique, espaces fibrés prin- 
cipaux en géométrie différentielle et en 
topologie différentielle en sont des exem- 
ples bien connus ; un autre exemple, plus 
remarquable encore, est la possibilité de 
définir une structure de groupe sur 
l’ensemble des classes de structures diffé- 
rentielles compatibles avec une variété 
(topologique) donnée. Cette tendance a 
gagné la physique elle-même : en cherchant 
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à expliquer les symétries expérimentales 
qu’ils constataient dans les phénomènes 
atomiques, les théoriciens se sont naturel- 
lement tournés vers la théorie des groupes, 
avec un succès assez remarquable, bien 
que fort mystérieux. 

JEAN DIEUDONNÉ 


A. Généralités 

On se propose de présenter ici les notions 
fondamentales de théorie des groupes qui 
interviendront constamment dans la suite. 
Celle-ci contient un très grand nombre 
d’exemples, c’est pourquoi cet exposé 
introductif n’explicite que quelques grou- 
pes utilisés aussi ailleurs, notamment en 
cristallographie, en chimie, en linguistique. 


1 . La structure de groupe 

Un groupe G est un ensemble muni d’une 
loi de composition interne : 

*y 

qui possède les propriétés suivantes : 

(a) Elle est associative , c’est-à-dire que, 
si a, b, C sont des éléments de G, on a : 

a * (b * c) = (a *b)*c ; 

(b) Elle admet un élément neutre , c’est- 
à-dire qu’il existe un élément f Ç G (néces- 
sairement unique, manifestement) tel que, 
pour tout a G G : 

a*e = e*a — a\ 

(c) Tout élément a de G admet un 
symétrique (en notation multiplicative on 


dira un inverse), c’est-à-dire qu’il existe un 
élément de G, noté a~\ tel que : 

a ~ 1 * a = a * a~ l = e. 

On ne se préoccupera pas ici de savoir 
si l’on peut affaiblir ces axiomes en jon- 
glant avec des hypothèses « à droite » et 
« à gauche » dans (b) et dans (c). Le 
groupe est dit commutatifs ou abélien, si la 
loi de composition est commutative, c’est- 
à-dire a * b = b * a pour tout couple d’élé- 
ments de G. Cette loi est alors souvent 
(mais pas toujours) notée additivement, 
par le signe + ; l’élément neutre est 
désigné par 0 et le symétrique d’un élément 
a est noté — a. C’est le cas, par exemple, 
pour la loi de groupe sous-jacente à une 
structure d’anneau ou d’espace vectoriel. 
On appelle ordre d’un groupe fini G le 
nombre G de ses éléments. 

Dans ce qui suit, sauf mention explicite 
d’une autre notation, la notation multipli- 
cative sera adoptée systématiquement, ce 
qui signifie que l’on notera X. y, ou plus 
simplement X}\ l’image du couple (x, y) par 
la loi de composition. L’élément neutre 
sera désigné par 1. Lorsque plusieurs 
groupes seront considérés simultanément, 
le même symbole 1 désignera donc plu - 
sieurs objets mathématiques distincts, ce 
qui paraît en contradiction avec les règles 
logiques les plus simples (cf. par exemple 
la formule (2) ci-dessous) ; en fait, cela 
n’est guère gênant, car le contexte mathé- 
matique permet toujours d’éviter toute 
ambiguïté. Ainsi, dans la formule ( 2 ), 
puisquefest une application de G dans G’, 
le symbole 1 dans la partie gauche de la 
formule représente l’élément neutre de G 
tandis que le 1 de droite représente l’élé- 
ment neutre de G’. 

Remarquons maintenant que, si l’on 
multiplie à gauche par a~ x les deux mem- 
bres de l’égalité ax — ü}\ on obtient, en 
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applicant l’associativité, lx = 1 y 9 d’où 

x =: y. On a ainsi obtenu la règle de 
simplification dans un groupe : si a, x, y 
sont des éléments d’un groupe, on a les 
équivalences : 

ax = ayaxa = ya^x =y. 

Une démonstration tout à fait analogue 
montre que, dans un groupe, les équations 
linéaires , du type ax = b , ou xa = b, ont 

toujours une solution unique ; par multi- 
plication à gauche par a -1 , on obtient par 
exemple que la première a pour solution 
x = a~ l b. 

Si x est un élément d’un groupe G et n 
un entier positif, on notera x” le produit de 
fl éléments égaux à x, et x~ n le produit de 
rt éléments égaux à x -1 . L’élément x° étant 
par définition l’élément neutre, on a donc 
défini X n pour tout entier relatif n et on 
vérifie facilement que deux puissances 
quelconques d’un même élément commu- 
tent toujours et que : 

x n x m =x m + n , 

en notation additive on écrit nx au lieu de 
X*. 

Morphismes 

Conformément aux définitions générales 
pour les structures algébriques, on dit 
qu’une applicationfd’un groupe G dans 
un groupe G’ est un morphisme, OU un 
homomorphisme, de groupe si on a : 

0 ) m) =mm 

pour tout couple d’éléments de G. Par 
exemple, le logarithme usuel réalise un 
homomorphisme du groupe multiplicatif 
R* des nombres réels strictement positifs 
sur le groupe additif de tous les nombres 
réels, car : 

ln xy = lnx + ln y, x t y G R* ; 


bien entendu, il faut, quand les deux 
groupes ne sont pas tous les deux notés 
multiplicativement, adapter les notations 
de la condition (1). Un morphisme bijectif 
est appelé un isomorphisme ; c’est le cas du 
logarithme qui réalise un isomorphisme du 
groupe multiplicatif RT sur le groupe 
additif R. Dans le cadre de la théorie des 
groupes, il n’y a pas lieu de distinguer des 
groupes isomorphes, et on parlera parfois 
(par abus de langage) de réalisation d’un 
même groupe pour désigner des groupes 
isomorphes. Remarquons enfin que, si on 
prend pour y l’élément neutre de G dans 

(1) , on obtient, après simplification : 

(2) f (1) = 1, 

qui montre que tout morphisme de G dans 
G’ transforme l’élément neutre de G en 
l’élément neutre de G’. Les groupes, et 
leurs morphismes, forment un exemple 
très simple de catégorie. 

Sous- g loupes 

Une partie non vide H d’un groupe G est un 
SOUS- groupe si le composé de deux éléments 
de H est encore un élément de H et si H est 
un groupe pour la loi de composition ainsi 
définie ; on vérifie facilement qu’une partie 
H non vide d’un groupe G est un SOUS- 
groupe si et seulement si xy ^ G H pour 
tout couple (x, y) d’éléments de H. Des 
exemples très simples de sous-groupes 
s’obtiennent à partir des morphismes : sif: 
G — ► G’ est un morphisme de groupe, alors 
son image /(G) est un sous-groupe de G’ et 
son noyau Ker /=/ ‘(1) est un sous- 
groupe de G (en fait, comme on le verra 
ci-dessous au chapitre 3, le noyau n’est pas 
n’importe quel sous-groupe). Si/: G —►G’ 
et g : G' — ► G" sont deux morphismes, on 
dira que la « suite » : 
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est exacte si l’image defest égale au noyau 
de g ; cette situation est fondamentale en 
algèbre homologique. 

Il est clair que l’intersection d’une 
famille quelconque de sous-groupes est 
encore un sous-groupe (éventuellement le 
sous-groupe { 1 } réduit à l’élément neutre). 
Par suite, si K est une partie quelconque 
d’un groupe G, il existe un « plus petit » 
sous-groupe contenant K, à savoir l’inter- 
section de tous les sous-groupes contenant 
K ; si H est ce sous -groupe, on dit qu’il est 
engendré par K, ou encore que K est un 
système de générateurs de H. Les éléments 
de H sont les produits finis X\X 2 où 
l’un au moins des deux éléments x f ou x, -1 
appartient à K ; en effet, tout sous-groupe 
contenant K contient ces éléments et 
l’ensemble de ces éléments est un groupe. 

Indiquons enfin que, si A et B sont deux 
parties d’un groupe G, on note AB 
l’ensemble des produits ah pour a G A et 
b G B. 

2. Quelques exemples 

Dans de nombreux cas, les éléments d’un 
groupe G seront réalisés comme des 
bijections d’un ensemble E sur lui-même ; 
par définition, le produit ab de deux telles 
bijections est alors la bijection composée 
obtenue en faisant d’abord b , puis a. 
L’ensemble Z(E) de toutes les bijections 
d’un ensemble E est un groupe, appelé le 
groupe symétrique de l’ensemble E, pour la 
loi de composition ainsi définie. 

Groupes cycliques 

Un groupe G est dit cyclique s’il est 
engendré par un de ses éléments a. Tout 
élément de G est ainsi une puissance de a, 
et G est donc commutatif. Par exemple, le 
groupe additif Z des entiers relatifs est 


engendré par l’élément 1 ; car, avec les 
notations ci-dessus, n = ni. Si G est un 
groupe cyclique quelconque (on revient à 
la notation multiplicative), engendré par 
(1 G G, l’application : 

n ] -^a n 

est un morphisme surjectif de Z sur G. Si 
ce morphisme est injectif, c’est un isomor- 
phisme. Dans le cas contraire, il existe des 
entiers n et n distincts tels que a n = a n ' ; 
si on suppose n > n , on en déduit 
a n-n f — i Désignons par p le plus petit 
entier positif tel que a p = 1 ; les éléments : 

a°= ,a 2 t aP~ l 

sont donc distincts et ce sont les seuls 
éléments du groupe G, car pour tout entier 
n on a : a n = a p(l + r — a r ûn — pq + r est 
l’identité de division euclidienne de n par 
p, avec r G {0, 1, ..., p— 1}. Ainsi tout 
groupe cyclique infini est isomorphe à Z ; 
tous les groupes cycliques finis de même 
ordre p sont isomorphes entre eux. On 
désignera le groupe cyclique d’ordre p par 
C /r On peut le réaliser comme l’ensemble 
des rotations du plan de centre 0 et 
d’« angles » 2 k = 0, 1, . . . . p 1. la 
loi de groupe étant la composition des 
rotations, ou encore comme l’ensemble 
des rotations d’angle 2 klt/p autour de 
l’axe Oz dans l’espace à trois dimensions. 
Remarquons que le groupe multiplicatif 
des racinesp-ièmes de l’unité dans le corps 
des nombres complexes (cf. nombres com- 
plexes) est aussi une réalisation de ce 
groupe. 

Groupes diédraux 

Pour n ^ 3, on appelle groupe diédral D„ 
le groupe des rotations et des symétries du 
plan qui conservent un polygone régulier à 
n sommets. Ce groupe est d’ordre 2 n , car 
il contient n rotations, qui forment un 
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sous-groupe isomorphe au groupe cyclique 
C n et n symétries (par rapport aux n droites 
joignant les sommets au centre du poly- 
gone). Si on numérote les sommets 1,2,.... 
n (en choisissant un « sens de parcours » 
sur le polygone), le groupe est engendré 
par la rotation a : 

1 2 3 . . . n-l n 

III II 

2 3 4 fl 1 

et la symétrie b : 

12 3 . .. /j — 1 « 

i i i i i 

1 n n-l . . 3 2 

autour de la droite joignant 1 au centre du 
polygone. Les générateurs a et b vérifient 
les « relations » : 

(3) a" — l, b 2 = I, ab = ba^ 1 ; 

il en résulte que tout élément du groupe est 
de la forme a k si c’est une rotation, ou de 
la forme a k b si c’est une symétrie, avec 
k = 0,1, n ™ 1. Ces relations détermi- 
nent entièrement le groupe D„. 

On peut donner des réalisations de D„ 
comme groupe de déplacements de 
l’espace à trois dimensions, par exemple en 
prenant pour rotations des rotations 
autour de l’axe Oz et pour symétries des 
symétries autour de n droites du plan xOy 
faisant entre elles des angles égaux ; on 
peut obtenir une autre réalisation en rem- 
plaçant les symétries précédentes par des 
symétries autour de ri plans passant par 
0:. En cristallographie, on considère aussi 
le groupe D nf} d’ordre 4 n des déplacements 
de l’espace à trois dimensions qui conser- 
vent un polygone régulier à n sommets du 
plan xOy ; on peut le réaliser comme le 
groupe engendré par D„ (dans la réalisa- 
tion précédente) et la symétrie par rapport 
à l’origine. 


Pour n = 2, les relations (3) définissent 
un groupe commutatif d’ordre 4, dont les 
éléments sont 1 , a, b, ab , avec a 2 = b 2 = 1, 
ab = bu. C’est le 4-groupe de Klein. On 
peut le réaliser comme le groupe des 
symétries qui conservent un rectangle (qui 
n’est pas un carré) ; les nombreuses réa- 
lisations intuitives que l’on peut donner 
de ce groupe lui donnent une grande impor- 
tance dans la pédagogie et l’enseignement 
élémentaire des mathématiques. 

Les « symétries » du cube 

Considérons un cube dont les sommets 
sont numérotés comme l’indique la figure. 


(D) 



Groupe des g symétries y du cube 


Le groupe G des déplacements conservant 
le cube est engendré par la rotation a : 

1 2 3 4 5 6 7 8 

I I I I I I I I 

23416785 
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autour de la droite D joignant les centres 
des deux faces opposées 1-2-3-4 et 5-6-7-8, 
par la rotation h : 

12345618 

I I I I I I I I 

14852376 

autour de la diagonale 1-7 et par la 
symétrie c : 

12345678 

I I I I I I I I 

56781234 

autour du plan équidistant des deux faces 
opposées ci-dessus. Ce groupe est d’ordre 
48. Les rotations forment un sous-groupe 
G, d’ordre 24 engendré par a et b ; c’est 
le groupe des déplacements conservant 
l’octaèdre régulier dont les sommets sont 
les centres des huit faces du cube. On peut 
aussi considérer le sous-groupe cyclique Hj 
d’ordre 3 engendré par b : c’est le groupe 
des rotations qui laissent fixe le sommet 1. 

Groupes libres 

Si un sous-ensemble K engendre un 
groupe G, tout élément de G est un produit 
fini d’éléments de K et d’inverses d’élé- 
ments de K, mais l’existence de « rela- 
tions » entre éléments de K fait qu’il peut 
y avoir plusieurs telles représentations (cf. 
supra). Nous allons examiner le cas où il y 
a unicité. 

Soit S un ensemble quelconque. On 
appelle mot de S soit l’ensemble vide, noté 
ici 1 et appelé le mot vide, soit une suite 
formelle finie : 

«î a 2 - a n 

d’éléments écrits / où S G S, avec 
E = + 1 ou — 1. On dira qu’un tel mot est 
réduit s’il ne contient pas de termes consé- 
cutifs de la forme s (E S ; à tout mot, 

on peut toujours associer le mot réduit 
obtenu en « gommant », c’est-à-dire en 


supprimant purement et simplement toute 
paire consécutive de ce type. On appellera 
alors groupe libre engendré par S l’ensem- 
ble des mots réduits muni de la loi de 
composition qui, à deux mots réduits 
f= a { a 2 ü n et g = b { b 2 b nv fait cor- 
respondre le mot réduit& obtenu à partir 
du mot : 

a i a 1 ...a„b,b 2 ...b mt 

obtenu en écrivant d’abordfpuis g. 11 est 
clair qu’on obtient bien ainsi un groupe, 
dont le mot vide est l’élément neutre ; le 
mot inverse est le mot obtenu en renversant 
l’ordre des termes et en remplaçant P« ex- 
posant » (égal à+louà — 1) de chaque 
terme par son opposé : en effet, par 
réduction on obtient alors le mot vide 
comme produit d’un mot et du mot inverse 
puisque, de proche en proche, on 

« gomme » tout en réduisant le mot obtenu 
en juxtaposant un mot et son inverse. 

Un groupe G est dit libre s’il est 
isomorphe au groupe libre engendré par 

un ensemble S, que l’on peut supposer 
inclus dans G en prenant pour S l’ensem- 
ble qui correspond dans l’isomorphisme 
aux mots d’une seule « lettre » avec 
E = -j— 1. L’ensemble S est un système de 
générateurs sans « relations », 

La théorie des groupes libres a été 

élaborée par J. Nielsen et 0. Schreier. Le 

résultat principal en est que tout SOUS- 
groupe d’un groupe libre est libre (c’est un 
résultat dont la démonstration est longue 
et très technique). 

3. Relations d’équivalence 
et quotients 

Dans ce qui suit interviendra souvent le 
fait que l’inverse d’un produit ab de deux 
éléments d’un groupe est le produit b~ [ a~ l 
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des inverses en renversant l’ordre ; car, en 
utilisant l’associativité : 

(ab)(b- ] a~') = a(bb-')a~ l 
- a \ a ~ l = aa~ l = 1. 

À partir d’un sous-groupe, on peut 
définir plusieurs relations d’équivalence 
sur un groupe. Si le sous-groupe vérifie une 
propriété supplémentaire, ces relations 
coïncident et on peut alors munir 
l’ensemble quotient d’une structure de 
groupe. 

Classes suivant un sous-groupe 

Soit G un groupe et H un sous-groupe de 

G. La relation : 

est une relation d’équivalence sur G. En 
effet x — g x 9 car x~ l x = 1 G H ; si x — g y 9 
l’élément x^y appartient à H et, par suite, 
aussi son inverse (x _1 j) _l = y _1 X, ce 
qui signifie : y — g x ; la transitivité résulte 
du fait que, si x~ l y et y~ l z sont deux 
éléments du sous-groupe H, leur produit 
(x -1 y)(p -1 z) = x l Z est aussi un élément de 

H. La classe d’équivalence d’un élément 
JC G G est l’ensemble xH des produits xh 
lorsque h parcourt H, appelé c/asse à 
gauche de x suivant H (ou modulo H). 
Deux classes à gauche sont disjointes ou 
confondues. Lorsque le nombre de classes 
à gauche distinctes est fini, on l’appelle 
l'indice du sous-groupe H dans G, et on 
note ce nombre [G : H]. Remarquons que, 
puisque, pour x fixé, l’application g xg 
est, d’après la règle de simplification (cf. 
chap. 1), une bijection de G sur lui-même, 
si le sous-groupe H est fini, toutes les 
classes à gauche ont le même nombre 
d’éléments que H. Pour G fini, on obtient, 
puisque les classes à gauche distinctes 
forment une partition, que l’ordre du 


groupe G est le produit de l’ordre de H par 
l’indice de H dans G, soit : 

I G | = [G : H] | H | , 

résultat obtenu par Lagrange, sous une 
forme différente, à propos de la théorie des 
équations et avant l’élaboration de la 
théorie des groupes proprement dite (cf. la 
partie C ci-après Groupes finis). 

Bien entendu, on pourrait définir de 
manière analogue les classes à droite Hjc 
pour la relation d’équivalence xy~ 1 £ H. 
La symétrie x ► x -1 est une bijection du 
groupe sur lui-même qui conserve les 
sous-groupes et échange les classes à gau- 
che et les classes à droite ; en particulier, 
si le nombre de classes à gauche suivant H 
est fini (c’est-à-dire H d’indice fini dans G), 
ce nombre est aussi le nombre de classes 
à droite. 

Revenons par exemple au groupe des 
« symétries » du cube, avec les notations 
du chapitre 2. Le groupe G] est d’indice 2 
dans G et ici les classes à gauche sont Gj 
et (’ Gj, groupe des déplacements directs 
(rotations) et ensemble des déplacements 
inverses conservant le cube. Deux élé- 
ments x et y de G J sont équivalents à 
gauche par rapport au sous-groupe H’ si et 
seulement s’ils envoient 1 sur le même 
sommet, puisque les éléments de H] 
conservent ce sommet 1. Il y a donc huit 
classes : H, x 2 H, X 3 H, X 4 H, X 5 H, x 6 H, X 7 H, 
X 8 H, où x, est une rotation quelconque de 
G j envoyant le sommet 1 sur le sommet / ; 
on peut prendre par exemple x 2 = fl, 
x 3 = a', x 4 = x 5 = ba 3 , x 6 = aba- , 
x 7 = a 2 ba 3 et x 8 — a 2 ba 3 . Ainsi H’ est 
d’indice 8 dans G t et on a bien : 



On voit de même que deux rotations de 
G, sont équivalentes à droite si et seule- 
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ment si le sommet 1 est l’image du même 
sommet i par ces deux rotations, ce qui 
permet d’expliciter les huit classes à droite. 

Indiquons enfin que, si H et K sont deux 
sous-groupes de G, on définit la double 
classe Ha'K d’un élément x G G suivant H 
et K ; si K = H, on parle de doubles 
classes suivant H. Comme ci-dessus, on 
montre, en introduisant une relation 
d’équivalence convenable, que deux dou- 
bles classes sont disjointes ou confondues. 

Automorphismes intérieurs 

Si G est un groupe, l’ensemble des auto- 
morphismes de G est un groupe, que nous 
noterons Aut(G), pour la composition des 
applications : c’est le sous-groupe du 
groupe symétrique C(G) de l’ensemble G, 
formé des bijections de G sur G qui sont, 
en plus, des morphismes. Nous allons 
mettre en évidence certains automorphis- 
mes qui jouent un rôle fondamental en 
théorie des groupes. 

Soit s un élément d’un groupe G. 
L’application a, : G-G définie par 
Cq(x) = SXS~ l est un automorphisme de G 
que nous appellerons V automorphisme 
intérieur défini par s \ en effet : 

oc 5 (xy) = = sx 1 ys~ l 

= (sxs~ l )(sys-') = a s (x)a s (y), 

et a v est manifestement bijectif, car 
y = oq(x) équivaut à x = ce qui 

montre que l’automorphisme réciproque 
est l’automorphisme intérieur défini par 
s ~ 1 . De plus, l’application s l “ i * a„ est un 
morphisme de G dans le groupe Aut(G), 
car on a : 

a„-(*) = ss'x(ss')~ l 

= SS'XS’ — 1 S — 1 = 5(S'XS / — 1 )5 — 1 

= oq(o[*'(x)) = oqoa 5 >(*); 

par suite, l’ensemble Int(G) de tous les 
automorphismes intérieurs est un SOUS- 


groupe de Aut(G). On appelle centre du 
groupe G le noyau Z(G) du morphisme 
s a, ; c’est un sous-groupe de G qui est 
l’ensemble des éléments ^ E G tels que 
sxs~ l — x , soit sx = xs, pour tout x G G. 
Ainsi le centre est l’ensemble des éléments 
de G qui commutent avec tous les éléments 
du groupe ; ce centre est un sous-groupe 
commutatif qui est transformé en lui-même 
par tout automorphisme de G. Plus géné- 
ralement, soit H un sous-groupe de G et S 
une partie de G (qui n’est pas nécessaire- 
ment un sous-groupe). On montre facile- 
ment que l’ensemble des éléments A G H 
qui commutent avec tous les éléments de S, 
c’est-à-dire tels que sx = xs pour tout 
S G S, est un sous-groupe de H, noté Z H (S) 
et appelé le centralisateur de S dans H ; avec 
cette extension, le centre apparaît comme 
le centralisateur de G dans G. 

Soit H un sous-groupe de G. On dit que 
deux éléments 5 , s’ GG sont conjugués par 
rapport à H s’il existe X G H tel que : 

s’ = xsx~ l = a, (s) 

il est clair, puisque H est un sous-groupe, 
que la conjugaison est une relation d’équi- 
valence sur G. Plus généralement, on dit 
que deux sous-ensembles S et S’ de G sont 
conjugués par rapport à H s’il existe x G H 
tel que S’ = xSx~ l ; si S est un SOUS- 
groupe, ses conjugués sont les SOUS- 
groupes images de S par les automorphis- 
mes intérieurs a x , x G H. Revenant à un 
sous-ensemble S quelconque, on vérifie 
facilement que l’ensemble N H (S) des élé- 
ments x G H tels que S = xSx~ [ est un 
sous-groupe de H appelé normalisateur de 
S dans H ; bien entendu, Z H (S) est un 
sous-groupe de N H (S). 

Dans tout ce qui précède, on supprime 
la référence à H si H = G ; on parle alors 
d’éléments conjugués, de centralisateur, de 
normalisateur. 
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Sous-groupes distingués 
Si un groupe H est le noyau d’un mor- 
phisme f d’un groupe G dans un groupe 
G’, pour tout xE G et y EH, donc 
f (>’) = 1, on a : 

= /(*)/(*~') =/(xt->) = 1, 

d’après (2) et, par suite, xyx 1 = 
a v 0’) E H ; ainsi xHx -1 = H pour tout 
x E G et H est égal à tous ses conjugués. 
On dit qu’un sous-groupe possédant cette 
propriété est distingué (ou normai, ou 
invariant) ; ainsi les noyaux des morphis- 
mes sont des sous-groupes distingués. En 
fait, on va voir aussi que tout sous-groupe 
distingué est le noyau d’un certain mor- 
phisme. 

Revenons pour un instant à un sous- 
groupe quelconque H d’un groupe G et 
désignons par G/ H l’ensemble des classes 
à gauche suivant H, c’est-a-dire l’ensemble 
quotient de G par la relation d’équivalence 
à gauche suivant H, et par f : G — ► G/ H 
l’application canonique qui à tout x G G 
associe sa classe à gauche. S’il est possible 
de munir G/H d’une structure de groupe 
pour laquelle f est un morphisme, alors, 
d’après (2), l’élément neutre de ce groupe 
est la classe de 1 et le noyau de f est donc 
H ; ainsi H est nécessairement un SOUS- 
groupe distingué. Réciproquement, si on 
suppose maintenant H distingué, la classe 
d’un produit xy ne dépend que des classes 
de X et y, car, si x~ l x’ E H et y~ ] y' E H, 
c’est-à-dire x et y équivalents (à gauche) à 
x' et y’ respectivement, on a : 

(xy)-'x’y' ~ x x- l x'y’ 

= (y-'x- l x'y)(y-Y)e H, 

comme produit de deux éléments de H (le 
premier est l’image de x *x' par T auto- 
morphisme intérieur défini par y), et on 
vérifie facilement qu’on peut ainsi munir 


G/H d’une structure de groupe pour 
laquelle l’application canonique est un 
morphisme. Le groupe G/H est appelé le 
groupe quotient de G par le sous-groupe 
distingué H ; si H n’est pas distingué, on 
peut cependant faire « opérer » le groupe 
sur l’espace G/H et on obtient alors ce 
qu’on appelle un espace homogène (cf. 
chap. 5). L’application canonique f réalise 
une bijection entre les sous-groupes de G 
contenant H et les sous-groupes de G/ H, 
à un sous-groupe distingué correspondant 
un sous-groupe distingué et vice versa. 

Si f : G — ► G’ est un morphisme de 
noyau H, le premier théorème d’isomor- 
phisme des groupes affirme que le groupe 
quotient G/H est isomorphe au groupe 
f ( G) image de G par f par le morphisme 
qui, à chaque classe, fait correspondre la 
valeur constante de / sur cette classe. Il en 
résulte que f peut s’écrire comme composé 
de trois morphismes qui sont (respective- 
ment de gauche à droite) surjectif, bijectif 
et injectif : 

G G/H -f(G) — G 

Indiquons enfin un autre résultat d’iso- 
morphisme. Si H est un sous-groupe dis- 
tingué de G et L un sous-groupe quelcon- 
que, alors LH = HL est un sous-groupe, 
H H L est un sous-groupe distingué de L et 
les deux groupes L/(H n L) et HL/H sont 
isomorphes, 

Suites de composition 

Dans un groupe G, le sous-groupe { 1 } 
réduit à l’élément neutre et le groupe G 
lui-même sont distingués ; si ce sont les 
seuls sous-groupes distingués de G, ce 
groupe est dit simple. A l’opposé, dans un 
groupe commutatif, tous les sous-groupes 
sont distingués. Nous allons expliquer 
maintenant comment on peut préciser la 
structure d’un groupe en fabriquant des 
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suites de sous-groupes encastrés. Pour 
éviter des interprétations erronées, il sera 
bon de se rappeler qu’il n’y a pas transi- 
tivité de la notion de sous-groupe distin- 
gué : si K C H C G, K sous-groupe dis- 
tingué de H et H sous-groupe distingué de 
G, le sous-groupe K de G n’est pas 
nécessairement distingué dans G. 

On appelle suite de composition d’un 
groupe G une suite strictement décrois- 
sante : 

G 0 =GDGpG 2 D„JG ff = {1} 

de sous-groupes telle que G /+1 soit un 
sous-groupe distingué de G, pour i — 0, 
1, .... n — 1 ; les groupes quotients G,-/G/+i 
s’appellent les facteurs de composition de la 
suite ; si tous les facteurs de composition 
sont simples, on dit qu’on a une suite de 
Jordan-Holder ; dans un groupe fini, on 
peut toujours trouver de telles suites de 
Jordan-Holder et leur longueur est un 
important invariant du groupe (cf. théo- 
rème de Jordan-Holder dans la partie C 
ci- après Groupes finis, chap. 2). 

Examinons ici les groupes dits résolubles 
admettant des suites de composition dont 
tous les facteurs de composition sont com- 
mutatifs ; historiquement, cette notion est 
liée à la résolubilité des équations algébri- 
ques par radicaux, d’où la terminologie 
(cf. CORPS, chap. 3). Nous aurons pour cela 
besoin d’une condition exprimant que le 
quotient G/H d’un groupe G par un sous- 
groupe distingué H est commutatif. S’il en 
est ainsi, quels que soient x et y dans G, les 
classes de xy et yx suivant H doivent être 
égales ; donc l’élément : 

(x,y) = (xy)— l yx = y - x x~ l yx, 

appelé commutateur de x et y, doit appar- 
tenir à H. De manière générale, si H et K 
sont des sous-groupes de G, notons (H, K) 
le groupe engendré par les commutateurs 


(JC, y) pour x G H et V G K (attention, le 
produit de deux commutateurs n’est pas 
un commutateur en général). Le groupe 
quotient G/H est donc commutatif si 
et seulement si H contient le groupe 
(G, G) = D(G) appelé groupe des com- 
mutateurs de G , ou groupe dérivé ; ce 
groupe est évidemment transformé en 
lui-même par tout automorphisme de G et, 
en particulier, il est distingué dans G. On 
peut donc itérer cette opération de « déri- 
vation » et construire la suite décroissante 
des groupes dérivés successifs : 

G D D(G) D D 2 (G) 

= D(D(G)) 3 . 3 D’ + 1 (G) = D r (D(G)) ; 

on montre alors qu’un groupe G est 
résoluble si et seulement s’il existe un entier 
r tel que D' +1 (G) = {1} et qu’ alors il 
existe une suite de composition dont tous 
les termes G,- sont des sous-groupes distin- 
gués dans G (et non pas seulement dans le 
sous-groupe précédent G,_j) et dont tous 
les facteurs de composition sont commu- 
tatifs. 

Si G est un groupe fini , il est résoluble 
si et seulement s’il admet une suite de 
Jordan-Holder dont tous les facteurs de 
composition sont des groupes cycliques 
d’ordre premier. 

On montre que tout sous-groupe ou 
tout groupe quotient d’un groupe résoluble 
est résoluble. 

Un cas particulier de groupes résolubles 
est fourni par les groupes nilpotents qui 
sont les groupes admettant une suite de 
composition : 

GDG,3G 2 D...DG„= {1} 

telle que chaque groupe quotient G,_i/G, 
soit dans le centre du groupe G/Gj (une 
telle suite est dite centrale) ; dans le cas de 
groupes finis (cf. la partie C ci- après - 
Groupes finis, chap. 3), on peut donner 
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diverses autres caractérisations, Définis- 
sons par récurrence le commutateur de k 
éléments .Vj, . . . . Xj, de G comme : 

(*I. *2». ...**) = (C*l. -,**- 1 ),**) 

et désignons par C*(G) le groupe engendré 
par les commutateurs de k éléments de G. 
On vérifie que les groupes C*(G) peu- 
vent être définis par les relations de récur- 
rence : 

C 2 (G) = D(G), C'+'(G ) = (C'(G ), G), 

et forment une suite décroissante de SOUS- 
groupes (appelée série centrale descen- 
dante). Un groupe G est alors nilpotent si 
et seulement s’il existe un entier Y tel que 

C‘ +I (G) = {1}. 


4. Produits 

Soit n groupes Gj, • . . . G„. L’ensemble 
produit : 

G = G] x G 2 x X G, 

est un groupe, appelé groupe produit, pour 
la loi de composition : 

(x l ,x 2 , ...,x n )(y lt y 2 , ...,y H ) 

= (x ] y h x 2 y 2 f ...yX n y„); 

si . . . . H„ sont des sous-groupes de 

G, , G 2 , G„ respectivement, le groupe 
produit : 

H, X H 2 X X H„ 

est un sous-groupe de G, distingué si 
chacun des H, l’est. Prenons en particulier 

H, = G, et H ; == {1} pour j ¥=-i\ le 
groupe produit est un sous-groupe distin- 
gué de G isomorphe à G, et nous identi- 
fierons ces deux groupes. Remarquons 
que, en effectuant cette identification, tout 
élément de G, commute avec tout élément 
de G, pour i j. 


Dans la situation précédente, le groupe 
G apparaît comme produit de certains de 
ses sous-groupes et les groupes obtenus en 
changeant l’ordre des groupes facteurs 
sont isomorphes. 

On dira qu’un groupe G est produit 
direct d’une famille finie Hj, . . . . H,, de 
sous-groupes distincts de G si tout élément 
de H, commute avec tout élément de H, 
pour i ^ j et si tout élément u de G s’écrit 
de manière unique comme un produit : 

u = u x u 2 ... u„, u, G H/ ; 

on dit que Uj est le composant de u dans H,. 
Cela entraîne que les H, sont des SOUS- 
groupes distingués de G et que l’applica- 
tion : 

(u u u 2 ,'..,u n )^u l u 2 ...u„ 

est un isomorphisme du groupe produit 
H { X X H„ sur le groupe G. Si 
Hj, H 2 , H„ sont des sous-groupes dis- 

tingués d’un groupe G tels que : 

(H I H 2 ...H / )flH /+1 = Ul, i = 1 ,..., n - I , 

on montre que l’ensemble Hi H 2 H„ est 
un sous-groupe distingué de G qui est 
produit direct de la famille considérée. 

Un sous-groupe distingué H d’un 
groupe G est dit facteur direct dans G s’il 
existe un sous-groupe distingué K de G tel 
que G soit égal au produit direct de H et 
K ; remarquons que le groupe K est alors 
isomorphe au groupe quotient G/H. 

En notation additive, on parle de 
somme directe au lieu de produit direct. 

Le produit direct permet de définir une 
nouvelle et importante classe de groupes 
(cf. ci-après les parties B - Groupes clas- 
siques et géométrie et E Groupes de 
Lie). Un groupe G est dit semi-simple s’il 
est produit direct d’un nombre fini de 
sous-groupes simples (c’est-à-dire dont les 
seuls sous-groupes distingués sont tri- 


527 



GROUPES 


viaux). On montre que le nombre de ces 
sous-groupes, appelé la longueur de G, est 
le même pour toutes les expressions de G 
comme produit direct de sous -groupes 
simples. Si G est produit direct d’une 
famille finie (H,), i G I, de sous-groupes 
simples, tout sous-groupe distingué K 
est isomorphe au produit direct d’une 
sous-famille (H,), j G J, J C 1 ; en particu- 
lier tout sous-groupe distingué est semi- 
simple, de longueur inférieure ou égale à 
celle de G (avec égalité des longueurs si et 
seulement si K — G). Il en est de même 
des groupes quotients d’un groupe semi- 
simple. 

On va maintenant généraliser la notion 
de produit direct. Soit H et K deux 
groupes, et soit donné, pour tout x G H, 
X ^ T v un morphisme de H dans le groupe 
Aut (K) des automorphismes de K. On 
appelle produit semi-direct de H pur K 
relatif à T l’ensemble H X K, muni de la 
loi de composition : 

(x,y)(x',y')= (xx’,T x (y)y'), 

qui est un groupe ; on notera H X T K ce 
produit semi-direct. Si T Y (y) = y pour tout 
X G H, on retrouve le produit direct défini 
ci-dessus. On vérifie que les éléments de la 
forme (x, 1), je G H, forment un SOUS- 
groupe de G isomorphe à H et que les 
éléments de la forme (1, v), y G K, forment 
un sous-groupe distingué de G isomorphe 
à K. Réciproquement, soit G un groupe, H 
un sous-groupe de G et K un sous-groupe 
distingué de G tel que H fl K = {1}. 
Cela a pour conséquence que xy = x'}’\ 
pour x, x' G H et y, y G K, entraîne 
X = x’ et y ~y (car on a alors x' _1 X = 
ÿy~ x GHflK, d’où x~ 1 x ^ ÿy~ x — 1). 
Puisque K est distingué, pour tout x GH, 
l’automorphisme intérieur défini par x~ l 
induit un automorphisme de K que nous 
désignerons par r v . On voit alors facile- 


ment que HK est un groupe isomorphe au 
produit semi-direct de H par K relative- 
ment à x ; en effet, pour x, x’ G H et y\ 
y’ G K, on a : 

xyx'y' = xx' (x'-'yx')}?' = xx'T x (y)y' ; 

le groupe quotient HK/K est isomorphe 
à H 


5. Groupes d e transformations 

Si E est un ensemble, nous avons déjà 
indiqué que les bijections de E sur lui- 
même forment un groupe £ (E) pour 
la composition des applications, le 
groupe symétrique de E. Si E est muni 
d’une structure, les bijections qui conser- 
vent cette structure forment un SOUS- 
groupe de C(E), le groupe des automor- 
phismes de E pour la structure considérée. 
C’est ainsi qu’on a introduit ci-dessus le 
groupe Aut(G) des automorphismes d’un 
groupe G ; si V est un espace vectoriel, on 
obtient le groupe linéaire de V, noté 
GL(V), formé des bijections linéaires de V 
sur V. 

On dit qu’un groupe G opère sur un 
ensemble E si E est muni d’une loi externe 
dont le domaine d’opérateurs est G : 

( g,x)^gx y 

de telle sorte que g(hx) = (gh)x et 1 x = x 
pour g, h G G et x G E. Cela entraîne que, 
pour g G G, l’application p(g) : E — ► E qui 
à x fait correspondre gx est une bijection 
de E sur lui-même (dont la bijection 
réciproque est p(g l )) ; la condition d’asso- 
ciativité s’écrit p (g h) — p (g) o p (h) et 
exprime donc que p est un morphisme de 
G dans le groupe symétrique C(E). On 
appelle un tel morphisme une représenta- 
tion du groupe G dans le groupe £(E) ; si 
p est un isomorphisme de G sur son image, 
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on dit qu’on a réalisé le groupe G comme 
groupe de transformations de E. Remar- 
quons qu’on peut toujours réaliser un 
groupe comme groupe de transformations 
de l’ensemble qui lui est sous-jacent en 
identifiant tout élément g G G à la trans- 
lation à gauche h *—* gh. Dans ce qui suit, 
nous considérerons un groupe G qui opère 
sur un ensemble E. 

Pour x G E, on appelle orbite de x 
l’ensemble des éléments gx pour g G G ; 
remarquons que les orbites de deux élé- 
ments sont toujours disjointes ou confon- 
dues, car la relation .Y ~ y, s’il existe g G G 
tel que y = gx, est une relation d’équiva- 
lence sur E. On appelle classes d'intransi- 
tivité les classes pour cette relation d’équi- 
valence, c’est-à-dire les orbites disjointes. 
Le groupe est dit transitif s’il n’existe 
qu’une seule classe d’intransitivité (E tout 
entier). Cela signifie que, si x et V sont deux 
éléments quelconques de E, il existe au 
moins un élément g G G tel que y = gx ; 
si cet élément g est de plus toujours unique, 
le groupe est dit simplement transitif. Plus 
généralement, on dit que le groupe G est 
n-füis transitif si E contient au moins n 
éléments et si, étant donné deux systèmes 
quelconques A' b x n et . y n de n 

éléments de E, il existe au moins un 
élément g G G tel que y, = gXj pour 
i = 1, 2, ... . n. On verra de nombreux 
exemples de ces situations dans les articles 
sur les groupes classiques et sur les groupes 
finis. 

On appelle enfin espace homogène un 
ensemble E muni d’un groupe transitif 
d’opérateurs. Voici, pour terminer, un 
exemple important de cette situation, 
auquel on peut toujours se ramener par un 
isomorphisme. Soit G un groupe et H un 
sous -groupe quelconque de G ; désignons 
par G/H l’ensemble des classes à gauche 
suivant H. Il est clair que, pour g G G, 


l’application qui à la classe à gauche de x 
fait correspondre la classe à gauche de gx 
est une bijection de G/ H sur lui-même et 
que l’on fait ainsi opérer G transitivement 
sur l’ensemble G/ H, ce qui munit cet 
ensemble d’une structure d’espace homo- 
gène. Réciproquement, si E est un ensem- 
ble sur lequel opère transitivement un 
groupe G, soit a un élément de E et 
désignons par H, le sous-groupe des élé- 
ments de G laissant a invariant, c’est-à-dire 
tels que ga = a ; on vérifie facilement que 
l’espace homogène E est isomorphe (en 
tant qu’espace homogène) à l’espace 
homogène G/H a des classes à gauche de G 
suivant le sous-groupe H„. 

JEAN-LUC VERLEY 
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B. Groupes classiques et géométrie 

Jusque vers 1800, la géométrie dite « élé- 
mentaire » est restée à peu de chose près 
ce qu’elle était dans l’Antiquité, tant dans 
sa substance que dans ses méthodes 
(l’invention de la « géométrie analytique » 
ayant à peu près exclusivement servi à 
prolonger le champ d’action de la géomé- 
trie classique dans les directions de la 
géométrie algébrique et de la géométrie 
différentielle). Mais, même dans les expo- 
sés d’Euclide et de ses continuateurs, bien 
que l’intérêt se concentre sur les propriétés 
des figures « classiques » (triangle, rectan- 
gle, parallélogramme, cercle, coniques, 
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etc.), les isométries (transformations de 
l’espace ou du plan conservant les distan- 
ces) jouent un rôle essentiel, non toujours 
explicité ; le fait qu’elles forment un 
groupe était implicitement utilisé bien 
avant que la notion abstraite de groupe ne 
se fût dégagée. À partir de 1800 environ, 
avec le développement de la géométrie 
projective, on commence à distinguer, 
parmi les notions géométriques invariantes 
par isométrie, celles qui sont de nature 
« descriptive » de celles que l’on qualifie de 
« métriques », les premières restant inva- 
riantes par des transformations plus géné- 
rales , à savoir celles qui transforment 
linéairement les coordonnées cartésien- 
nes ; par exemple, dans le plan, au point 
(x, y) correspond le point (x', y’) tel que : 

x ' — a.x -j~ bx c, y* = a'x + b'y + c\ 

C’est ainsi que, par une telle transfor- 
mation, une médiane d’un triangle se 
transforme en une médiane du triangle 
image : la notion de médiane est « des- 
criptive » ; au contraire, une hauteur d’un 
triangle n’a pas cette propriété : la notion 
de hauteur est « métrique ». Avec Félix 
Klein et son ((programme d’Erlangen » 
( 1872 ), cette distinction s’est précisée, et le 
concept même de « géométrie » a reçu une 
définition générale, englobant la géométrie 
classique (dite aussi « euclidienne »), la 
géométrie projective, la géométrie 
conforme, les géométries « non euclidien- 
nes », etc. : une géométrie est l’étude des 
notions et des propriétés qui restent inva- 
riantes par un groupe donné de transfor- 
mations. De ce fait, la « géométrie », après 
Klein, est devenue essentiellement l’étude 
de ces groupes, les propriétés des « figu- 
res » classiques passant au second plan ; 
plus généralement, dans toutes les parties 
des mathématiques où intervient un espace 
homogène G/H (ou, ce qui revient au 


même, un espace dans lequel un groupe G 
opère transitivement), un principe fécond 
est d’en ramener l’étude à celle du groupe 
G lui-même. 

Les groupes envisagés par Klein et cer- 
taines de leurs généralisations sont connus 
sous le nom de « groupes classiques » ; en 
tant que groupes de Lie, ils correspondent 
aux algèbres de Lie simples « classiques » 
(cf. la partie E ci-après-Groupes de Lie) et, 
de ce fait, la théorie des représentations 
linéaires (de dimension finie) et des inva- 
riants de ces groupes peut être regardée 
comme entièrement connue (ihid.) ; ce qui, 
en un certain sens, permet de considérer les 
« géométries » correspondantes comme 
essentiellement achevées et ne présentant 
plus aucun problème digne de recherches 
mathématiques sérieuses. 

Nous allons parler d’abord en détail des 
deux groupes les plus liés à la géométrie 
classique, le groupe linéaire général et le 
groupe orthogonal ; mais nous nous place- 
rons d’emblée dans la géométrie à n 
dimensions (n arbitraire > 2). Nous Sup- 
posons connus du lecteur les notions et 
résultats fondamentaux de l’algèbre 
linéaire et multilinéaire, exprimés dans le 
langage géométrique des espaces vecto- 
riels ou projectifs ; il pourra voir combien 
l’algèbre linéaire facilite, dans ces groupes, 
la solution de problèmes qui présentent de 
grandes difficultés dans des groupes quel- 
conques. 

1. Le groupe linéaire général 

Soit E un espace vectoriel de dimension n 
sur le corps R des nombres réels ; on 
appelle groupe linéaire général de E et on 
note GL(E) le groupe de tous les auto- 
morphismes de l’espace vectoriel E (ou 
transformations linéaires de E en lui- 
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même) ; il est isomorphe au groupe GL («, 
R) des matrices inversibles d’ordre n sur R. 
L’application u l ~ ’ ► det(w), où det(w) dési- 
gne le déterminant de w, est un homomor- 
phisme de GL(E) sur le groupe multipli- 
catif R * des nombres réels ^ 0 ; le noyau 
SL(E), ou SL(fl, R), de cet homomor- 
phisme est appelé groupe imimodulaire ou 
groupe linéaire spécial. 

Généra teuis 

On caractérise aisément les involutions de 
GL(E), transformations u telles que u 2 
= 1 ou w _1 = U, Comme on peut écrire : 

X “ ~(x + «(*)) + i(x— u(x)), 

on voit que E est somme directe de deux 
sous-espaces V + , Y dans lesquels on a 
respectivement u(x) = x et u(x) ™ — x 
(ce sont donc les sous-espaces propres 
de u pour les valeurs propres 1 et — 1) ; on 
a : 

det(w) = ( - 

où dim V - est la dimension de l’espace 
vectoriel V - . Si V“ = {0}, u est l’identité ; 
si V+ = {0}, U est la symétrie x I— ► — x. 
Lorsque V + est un hyperplan H, on dit que 
u est une réflexion d’ hyperplan H. 

Si H est un hyperplan d’équation 
f(s) = 0 {f forme linéaire), les transfor- 
mations de GL(E) qui laissent invariants 
tous les points de H sont de deux 
sortes : 

a) les dilatations : une telle transforma- 
tion U est définie par une droite D sup 
plémentaire de H et par un nombre \ ■=£ 
1 tels que u(x) = Xx dans D, d’où : 

u(x) —p(x)+ X(x — p(x)); 

pour x quelconque dans E, p(x) étant la 
projection de x sur H parallèlement à D 



(fig. 1). On a det(w) = A ; pour A = 1, 

on obtient les réflexions d’ hyperplan H. 
b) les transvections , de la forme : 

u(x) = x +/(x)fl, 


ou a G H ; dans l’ hyperplan affine H, 
parallèle à H, d’équation f (x) = 1, u est 
la translation z ► z + a (fig. 2). 



On dit que u est une transvection 
d’ hyperplan H et de droite D ^ Ra ; on 
a det(w) = 1. Les transvections forment 
un système générateur de SL(E) ; les 
dilatations et les transvections engendrent 
GL(E). Toute transvection est produit de 
deux réflexions. 
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Centralisateurs 

Soit Z = Z(E) le groupe des homothéties 
h ^ : X Ax de rapport A ^ 0, qui est 
isomorphe à R *. Une homothétie peut 
être caractérisée comme une transforma- 
tion de GL(E) laissant invariante (globa- 
lement) toute droite de E. 

Pour tout hyperplan H de E, les trans- 
vections d’ hyperplan H forment un groupe 
commutatif 0(E, H) isomorphe au groupe 
additif H ; son centralisateur dans GL(E) 
est le groupe ZO(E, H). Une transvection 
# 1 et une dilatation ne sont jamais 
permutables ; le centralisateur dans GL(E) 
du sous-groupe F(E, H) laissant invariants 
tous les points de H est donc réduit à Z ; 
en particulier Z est le centre de GL(E), et 
Z H SL(E) le centre de SL(E) (isomorphe 
au sous-groupe de À E R tels que À” = 1, 
donc réduit à l’élément neutre, si n est 
impair, et formé de l’identité et de la 
symétrie x •“* —x, si n est pair). 

Les transvections de droite donnée D 
(et d’hyperplan variable contenant D) 
forment un groupe commutatif 0' (E, D) ; 
le centralisateur de ce sous-groupe dans 
GL(E) est Z0'(E, D). 

Propriétés de transitivité 
et de conjugaison 

Le groupe SL(E), et a fortiori GL(E), 
opère de façon doublement transitive sur 
les droites de E ; si (Dj, D 2 ) et (D j, D 2 ) 
sont deux couples de droites distinctes, 
il existe au moins une transformation 
u E SL(E) telle que u( Dj) = D' b 
m(D 2 ) = D ' 2 ; si n = 2 , GL(E) opère de 
façon triplement transitive sur les droites de 
E. En général, on appelle repère projectif d? 
E un système (Dj) de n + 1 droites de E 
dont n quelconques ne sont pas dans un 
même hyperplan ; pour deux repères pro- 
jectifs (D,) et (D’,), il existe u E GL(E) tel 


que u(Dj) = D’, pour 1 ^ j ^ n -j- 1, et u 
est déterminé à un facteur h ^ près. 

Deux réflexions quelconques sont 
conjuguées dans GL( E) ; ii en est de même 
de deux transvections ^ 1. Si n ^ 3 , deux 
transvections 7 ^ 1 sont conjuguées dans 
SL(E) ; au contraire, si n = 2 , il y a deux 
classes de transvections conjuguées dans 
SL(E) : si t est une transvection ^ 1, ? et 
f* sont conjuguées dans SL(E) pour k > 0 
mais non pour k < 0. 

En tout cas, comme : 

t =5 t 2 t~ l = (sts~ l }t ~ *, 

pour un S E SL(E), toute transvection est 
un commutateur de deux éléments de 
SL(E) et, par suite, SL(E) est égal à son 
groupe des commutateurs, qui est aussi le 
groupe des commutateurs de GL(E). 

Simplicité du groupe 

SL(E)/(Z n SL(E)) 

On va voir que tout sous-groupe distingué 
N de SL(E) est soit contenu dans le centre 
Z H SL(E), soit égal à SL(E). Supposons 
donc N CZ. 

a) N opère transitivement sur les droi- 

tes de E. En effet, si U E N n’est pas dans 
Z, il existe au moins une droite D telle que 
u(D) ^ D ; pour toute autre droite D’, il 
y a un v E SL(E) tel que v(D) = D’, donc 
wv -1 (D') # v -, (D') ou VUV *(D') D’, et 

on a VUV~ [ EN ; donc, pour toute droite Dj 
de E, il y a un Wj EN tel que u { (Dj) ^ Dj. 
Soit D 2 une droite distincte de Dj et 
montrons qu’il existe u E N tel que w(Dj) 
= D 2 . Comme SL(E) opère de façon 
doublement transitive sur les droites de E, 
il existe v E SL(E) tel que v(Dj) = Dj, 
v(D 2 ) = Mj(Dj) ; alors v 1 Wj v(D { ) = D 2 et 
v _l WjV E N. 

b ) Pour toute droite D de E, soit 
l’ensemble des v E SL(E) tels que 
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v(D) = D ; alors SL(E) = N. S D ; en effet, 
pour tout u G SL(E), il existe V G N tel que 
u(D) — v(D), donc v -1 u G S D . 

c) S D contient le groupe commutatif 
0'(E, D), qui est évidemment distingué 
dans S D , et on a vu (cf. Générateurs , supra) 
que les conjugués dans SL(E) du groupe 
0'(E, D) engendrent SL(E). Tout V G 
SL(E) peut donc s’écrire : 

n 

avec tj G 0'(E,D) ; puis on peut écrire 
S, = UjV i avec u ] G N et v,- G S D , en vertu 
du chapitre 2 ; puisque 0'(E, D) est 
distingué dans Sp, on a : 

avec /'/G 0'(E,D). Mais, comme N est 
distingué dans SL(E), un produit d’élé- 
ments de 0'(E, D) et d’éléments de N 
(dans n’importe quel ordre) peut toujours 
s’écrire ut avec U EN et f G 0'(E, D). 
Considérons alors deux éléments Vj = 
Mj v 2 = u 2 t 2 de SL(E), avec Wj, w 2 dans 
N et f|, dans 0'(E, D) ; on a donc : 

= «i('i«2'r 1 )(h«r 1 'r 1 )«r 1 £jv > 

en vertu de la commutativité du groupe 
0'(E, D). Mais on a vu plus haut (Proprié- 
tés de transitivité et de conjugaison) que 
SL(E) est égal à son groupe des commu- 
tateurs ; donc N = SL(E). 


2. Le groupe orthogonal 

On suppose donné sur E un produit 
scalaire : c’est une application bilinéaire : 


de E X E dans R, qui est en outre 
supposée symétrique , c’est-à-dire que : 

c* \y) = (y\*\ 

et positive non dégénérée, c’est-à-dire que : 

(*|*) > 0 

pour x 0 dans E. La donnée d’une telle 
application définit dans E une notion 
d’orthogonalité ; X, y dans E sont dits 
orthogonaux si l’on a (,v| y) = 0 (relation 
symétrique en X et y). On dit que deux 
sous-espaces vectoriels Y, W de E sont 
orthogonaux si tout vecteur de V est 
orthogonal à tout vecteur de W ; pour un 
sous-espace vectoriel V donné, l’ensemble 
des vecteurs orthogonaux à tous les vec- 
teurs de V est le plus grand sous-espace 
vectoriel orthogonal à V ; on l’appelle 
l’orthogonal de V et on le note V 1 . On a les 
relations : 

vnv±= 101, 

V + V 1 = E, 

dim V + dim V 1 = dim E, 

(v + wj^v^nw 1 , 

(vnwj^vHw^, 

(Y 1 ) 1 = v. 

L’exemple classique de produit scalaire 
dans R" est : 

n 

(*\y) = y n, ; 

j = 1 

inversement, pour tout produit scalaire 
(jv | v) sur E, il existe une base dite ortho- 
normale (ej) de E telle que : 

(ÉT/I «y) = 0 si / #/, 

(e/|e,) = 1 pour tout i. 

Un espace vectoriel E muni d’un pro- 
duit scalaire est ce qu’on appelle un espace 
euclidien ; sur un même espace vectoriel E, 
il y a une infinité de produits scalaires non 
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proportionnels, donnant une infinité de 
structures d’espace euclidien pour lesquel- 
les les notions d’orthogonalité sont distinc- 
tes ; toutefois tous ces espaces sont iso- 
morphes, en vertu de l’existence des bases 
orthonormales. On suppose dans ce qui 
suit que le produit scalaire est fixé , et on 
pose \\x | =(x x) ] t 2 (longueur du vecteur 
x). 

On appelle similitude de E une trans- 
formation linéaire U G GL(E) telle que : 

(k(x)|«0O) = m(*I y), 

quels que soient x, y dans E, où p = |u(w) est 
une constante ^ 0 dite multiplicateur de U ; 
on a nécessairement p > 0 comme on le 
voit en faisant y Si Uest la matrice 

de u rapporté à une base orthonormale, il 
revient au même de dire que : 

(1) <U=\\U~K 

Les similitudes forment un sous-groupe 
GO(E) C GL(E), et u !“► p(u) est un 
homomorphisme de ce groupe sur le 
groupe multiplicatif RT des nombres 
réels > 0 ; son noyau O(E) est appelé le 
groupe orthogonal de E (pour le produit 
scalaire considéré) ; c’est donc le SOUS- 
groupe de GL(E) formé des u tels que : 

(n(x)|«0>))= (*b); 

on peut montrer que c’est aussi le groupe 
de toutes les applications non supposées 
linéaires a priori telles que w(0) = 0, 

| u(x) | = J x | pour tout x G E. 

Toute homothétie h } est une similitude 
de multiplicateur À 2 ; toute similitude de 
multiplicateur p s’écrit d’une seule 
manière h K • v, où A = A/jJ et v G O(E) ; 
GO(E) est produit direct du groupe O(E) 
et du groupe multiplicatif Z+(E) des 
homothéties de rapport > 0, isomorphe à 
RT. 


Pour une transformation orthogonale 
de matrice (/, on a, d’après la formule (1), 
(det U) 1 = 1 ; le sous-groupe 0+(E), ou 
SO(E), des transformations orthogonales 
de déterminant 1 (aussi appelées rotations) 
est d’indice 2 dans O(E). Les similitudes 
appartenant au sous-groupe : 

GO+(E) = 0+(E) X Z+(E) 

sont dites directes, les autres inverses. 

Lorsque E = R rt , on suppose toujours 
que R w est muni du produit scalaire 
classique, et on écrit 0(n,-R) [resp. O 
R) ou SO (n, R)] au lieu de 0(R”) [resp. 
0+(R”)] et on l’identifie avec le groupe des 
matrices orthogonales (Le. telles que 
‘U = U~ ] ). Si E est de dimension n , le 
groupe O(E) est isomorphe à 0(n, R). 

Générateurs du groupe orthogonal 
Les involutions u de GL(E) qui appartien- 
nent à O(E) sont celles pour lesquelles les 
sous-espèces propres V + et V" (cf. Géné- 
rateurs, in chap. 1) sont orthogonaux : on 
dit encore qu’une telle involution est une 
symétrie orthogonale par rapport à V + . 
Lorsque V + est un hyperplan H, on dit 
encore réflexion orthogonale de droite 
V - = H 1 . Si dim E — n, toute transfor- 
mation orthogonale est produit de n 
réflexions orthogonales au plus. Lorsque 
V+ est de dimension n — 2, on dit que 
l’ involution est un renversement d’axe V~ ; 
pour n ^ 3, toute rotation est produit de 
n renversements au plus. Tout renverse- 
ment est un commutateur de 0+(E) si 
n ^ 3 : en effet, soit (e\, e 2 ) une base 
orthonormale de V - , et posons 
V + = Re 3 0 W, où W est orthogonal à 
e 3 ; on peut écrire u = vqvs, où Vj (resp. v 2 ) 
est le renversement d’axe Re, 0 Ré 3 (resp. 
Ré? 2 0 Re,) ; comme v? est conjugué de V| 
dans 0 + (E) [cf. infra, Propriétés de tran- 
sitivité et de conjugaison] et comme Vj = 
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V on a u = lHjjVjj -1 pour un s E O’(E). 
On en conclut que 0+(E) est son propre 
groupe des commutateurs et le groupe des 
commutateurs de O(E). 

Le centre Z 0 de O(E) est formé de 
l’identité et de la symétrie x !—► x. Si n 
est pair, Z 0 est aussi le centre de 0 + (E) ; 
sinon, le centre de 0+(E) est réduit à 
l’identité et O(E) est le produit direct 
Z 0 X 0+(E). 

Propriétés de transitivité 
et de conjugaison 

Pour que deux sous-espaces vectoriels V„ 
V 2 de E soient transformés l’un de l’autre 
par une transformation orthogonale, il faut 
et il suffit qu’ils aient même dimension ; il 
existe alors une rotation u telle que 
V 2 = w(Vj). Les symétries orthogonales 
par rapport à V, et V 2 sont alors conju- 
guées 

Le groupe 0(2, R) et les angles 

Pour une matrice U d’ordre 2 , le calcul 
montre que la relation ( 1 ) équivaut à 
dire que U peut prendre l’une des deux 
formes : 

“«)• -!)• 

avec a 2 + P 2 7 ^ 0 . 

Les matrices U [ (resp. JJ-)) sont celles 
des similitudes directes (resp. inverses). On 
déduit de ces formules que le groupe 
GO + (R 2 ) des similitudes directes est com- 
mutatif, donc aussi le groupe 0 + (R 2 ) des 
rotations ; GO+(R 2 ) opère de façon sim- 
plement transitive dans R 2 — {0}. On voit 
aussi que : 

GO + (R 2 ) U {0}CM 2 (R) 
est un sous-corps commutatif de l’anneau 


M,(R) ; il s’identifie au corps C des 
nombres complexes en identifiant la 
matrice : 

(« -<n 

V|5 a J 

au nombre complexe a + p /, image du 
vecteur de base e par la similitude 
correspondante. Le groupe 0+(R 2 ) est 
alors identifié ainsi au groupe multipli- 
catif U des nombres complexes de 
module 1. 

On appelle groupe des angles un groupe 
U isomorphe à 0+(R : ) (donc à U) mais 
noté additivement ; il n’y a, par suite, pas 
de distinction essentielle à faire entre les 
notations d’angle et les notations de rota- 
tion plane, bien qu’il soit commode de 
parler de la « rotation d’angle 0 » et de la 
noter : 

r(0) G 0+ (R2) = 0+ (2, R). 

Puisque, par définition, r est un iso- 
morphisme de U sur 0“*”(2, R), on a : 

r(0 + 0') = r(0)r(0'), 
r (0) = I (matrice unité), 
r(— 6) = (r(ô)) — 1 . 

Par définition, les éléments a et p dans 
lamatrice: 

«•-(; -:) 

se notent COS 0 et sin 0 et s’appellent le 
cosinus et le sinus de l’angle 0 G U. Les 
formules précédentes sur r se traduisent en 
les formules dites « trigonométriques » : 

cos (0 + 0') = cos 0 cos 0' — sin 0 sin 0', 
sin (0 + 0') = sine cos 0' + cos 0 sine’, 
cosO = 1, 
sinO = 0, 
cos( 0) = cos 0, 
sin( — 0) = — sin 0, 
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qui ne font donc que transcrire des pro- 
priétés du groupe 0 + (2, R). 

Pour deux vecteurs .y et y de R 2 de 
même longueur ||.v|| = j| J' j| ^ 0, il existe 
une rotation u et une seule telle que 
u(. y) = y ; l’angle 0 de cette rotation est 
appelé l’angle de y avec X et noté (x, y). Si 
les deux vecteurs sont unitaires, on a cos 

e = (.Y y). 

Si x, z sont trois vecteurs de même 
longueur dans R 2 , on a : 

(Cz) = <£y) + (ivz)- 

Le groupe des angles il contient des 
éléments d'ordre fini : par exemple, l’angle 
droit ô qui correspond au nombre com- 
plexe i E U ou à la matrice : 



on a 4 5 = 0 (un angle de « quatre droits » 
est Y angle nul). Il n’est donc pas possible de 
définir sur U une relation d’ordre pour 
laquelle les relations 0 > 0, 0' > 0 entraî- 
neraient 0 + 0' > 0, et il est absurde de 
parler d’un angle « plus petit qu’un autre », 
Il est tout aussi absurde de considérer un 
angle comme une « grandeur mesurable », 
puisqu’on sait que, pour de telles gran- 
deurs, il y a une relation d’ordre du type 
précédent. Par contre, une propriété fon- 
damentale du groupe U est l’existence d’un 
homomorphisme continu cp, noté : 

du groupe additif R sur U, qui est auto- 
matiquement dérivable et est le seul homo- 
morphisme continu tel que cp'(0) = i. Il est 
périodique et sa plus petite période posi- 
tive est 2 7T (ce qui définit le nombre TT). Le 
cosinus et le sinus d’un nombre réel t se 
définissent alors par : 

cos t = Re(e il ), sin / - Im(e il ) ; 


l’angle p tel que r(p) = e 1 est appelé radian 
et, si, pour un angle 0, on a r(e) = e l \ on 
dit (improprement) que test une « mesure 
en radians » de 0 (il y en a une infinité 
différant de multiples entiers de 2 îT ; 
cf. EXPONENTIELLE et LOGARITHME). On a 
vu plus haut (Générateurs du groupe ortho- 
gonal) que toute rotation r(0) est produit 
de deux symétries orthogonales si, «y 2 
autour de deux droites Dj, D 2 ; si X\ E D| 
et jy 7 G D 2 ont la même longueur et si 
(x,, x 7 ) = eu, on a 0 = 2(0. Notons enfin 
que 0 + (2, R) est le groupe des commu- 
tateurs de 0(2, R). 

Structure 

des transformations orthogonales 
Pour toute transformation orthogonale 
u G O(E), il y a une décomposition de E en 
sous-espaces deus à deus orthogonaux V, 
W, P„ P 2 . . . . P,, stables par U et tels que : 

a) la restriction de w à Y est l’identité ; 

h) la restriction de w à W est la symétrie 

x ^ — jc ; 

c) chacun des P, est un plan (espace de 
dimension 2) et la restriction Uj de w à P, 
est une rotation distincte de l’identité et de 
.Y *— ► — X. 

Si 4 ) est une isométrie de P sur R 2 , il 
existe un angle 0 ; distinct de 0 et de 26 tel 
que Uj= 4 ; l r(0^‘ ; -, et 0 y est déterminé 
« au signe près » indépendamment du 
choix de V I * ■ ; les valeurs propres de u sont 
1 (de multiplicité dim V), 1 (de multi- 

plicité dim W) et les e ±lQ J (ces dernières 
peuvent être multiples si 0 ; = ± 0^ pour 

j # k). 

On a det (u) = (- l) d,m w ; par suite, si 
U G 0 + (E) et si dim E est impair (resp. 

U 4 0+(E) et dim E puir), W est néces- 
sairement de dimension paire (resp. 
impaire) ; donc V ne peut être réduit à 0, 
en d’autres termes il existe au moins un 
vecteur x # 0 invariant par u. 
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Simplicité du groupe 0 + (3, R) 

Montrons que tout sous-groupe distingué 
N de 0 + (3, R) non réduit à l’identité est 
nécessairement égal à 0 + (3, R). Suppo- 
sons donc qu’il existe u 1 E dans N, de 
sorte que (cf. supra, Structure des trans- 
formations orthogonales) il existe une 
droite D dont tous les points sont inva- 
riants par u , et la restriction de u au plan 
P = D 1 est une rotation d’angle 0^0 
(déterminé « au signe près »), Distinguons 
trois cas : 

a) COS 0 = — 1 ou 0 = 26, autrement 
dit u est un renversement ; mais, comme N 
est distingué, il contient tous les renverse- 
ments (cf. supra, Propriétés de transitivité et 
de conjugaison, in chap. 2), et donc il est 
égal à 0 + (3, R) (cf. supra, Générateurs du 
groupe orthogonal). 

h) cos 0 < 0. Soit un vecteur de lon- 
gueur 1 dans D, Cj un vecteur de longueur 
1 dans P et e 2 — w(^j) E P ; on a 
(?1 e 2 ) = COS 0 < 0. Considérons un vec- 
teur x = Ae, -j- e , ; on a u(x) = Xe 3 + e 2i 
donc (.Y | u(x)) = À 2 + COS 8, et, en pre- 
nant A = (-COS 0) 1 / 2 , on obtient un vec- 
teur tel que (x u(x)) = 0 (fig. 3). Soit alors 
V le renversement d’axe Rx ; UVU~ X est le 
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renversement d’axe Ru(x). Comme N est 
distingué, 

v(^vu _1 ) = (vav- 1 )* -1 G N, 

et c’est le renversement d’axe orthogonal 
au plan Rx © R u(x). On est ainsi ramené 
au cas a. 

c) 0 < COS 0 < 1. On voit aisément 
qu’il existe un entier n > 0 tel que COS 
nQ < 0 ; comme u n £z N, il suffit d’appli- 
quer le cas b à u n et la démonstration est 
achevée. 

Les groupes O-Kn, R) pour n ^ 4 

En utilisant la simplicité du groupe 0 + (3, 
R), on peut, par un raisonnement tout aussi 
élémentaire mais assez long, prouver que : 

O + (n,R)/(Z 0 nO+(»,R)) 

est simple pour n ^ 5 ; cela entraîne que, 
si n ^ 5 est pair, il ne peut y avoir de 
sous-groupe T de 0+(n, R) tel que 0+(n, 
R) soit produit semi-direct de Z 0 et de T, 
car T serait d’indice 2, donc distingué. Par 
contre, le groupe 0+(4, R) a une structure 
tout à fait exceptionnelle, liée à l’existence 
du corps des quaternions H (cf. anneaux et 
algÈbres, chap. 2). Identifiant H et R 4 on 
montre en effet que toute rotation de R 4 
peut s’écrire x*—+sxt, où s et t sont deux 
quaternions tels que N(s)N(t ) - 1 ; en 
outre, si sxt = s’xt * pour tout x GH, on a 
nécessairement s’ = As, f = A- pour un 
À G R. On en déduit que le groupe 
0 + (4, R)/Z 0 est isomorphe au produit de 
deux groupes simples isomorphes à 0 + (3, 
R) ; mais Z 0 n’est pas facteur direct dans 
0+(4, R). 

Spineurs 

L’algèbre des quaternions sur R se géné- 
ralise de la façon suivante. Pour tout 
entier n ^ 2, il existe une algèbre C n 
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sur R, de dimension 2", dite algèbre 
de Clifford d’indice n, qui est engendrée, 
en tant qu’ algèbre, par l’élément unité 1 et 
H éléments e, (1 ^ ^ n) identifiés à 

la base canonique de R", et qui sont 
assujettis à vérifier les conditions suivan- 
tes : 


e i e i = ~ e j e h si i¥=j, 
e)- — 1 , pour tout i. 

On montre que les 2 n produits : 

-*i, 

(où 0 ^ n, q < h < < î p ) forment 

une base sur R de l’espace vectoriel C„. 
Ceux de ces éléments pour lesquels p est 
pair forment une sous-algèbre C^de C m de 
rang 2 n 1 sur R. Pour deux vecteurs a et 
X de R"C C,„ on a ax -f~ Xü = — (A* | a) 
dans C„, donc — 2{ü cl) =z a 2 et finale- 
ment, si a 0, 


axa~ l 


-x + 2 


(*|a) 

(a ja) ’ 


ce qui prouve que l’application 
X 1—1 “ — axer 1 de R 77 dans lui-même n’est 
autre que la réflexion orthogonale s ü de 
droite Ra (cf. supra, Générateurs du groupe 
orthogonal). 

Le groupe multiplicatif engendré dans 
CJ par les produits ab, où a et b varient 
dans R/ 7 — {0} et sont de longueur 1, est 
noté Spin(fl) ; on montre qu’il existe un 
homomorphisme surjectif et un seul g : 
Spin(tf) — ► 0+(n, R) tel que o üh = S cl S h ; le 
noyau de cet homomorphisme est formé 
de l’identité et de — 1, mais Spin(/7) n’est 
pas produit semi-direct de ce sous-groupe 
et d’un groupe isomorphe à O + (/7, R). 
Lorsque l’on considère C J comme un 
espace vectoriel sur lequel Spin(rt) opère 
par multiplication à gauche, les éléments 
de C* sont appelés spineurs (cf. la partie E 
ci-dessous Groupes de Lie). 


3. Les groupes orthogonaux 
des formes non positives 

Dans le chapitre 2, on peut remplacer, au 
départ, le produit scalaire par une forme 
bilinéaire symétrique non dégénérée quel- 
conque O (a, y) ; pour une telle forme, il 
existe toujours au moins une base (dite 
adaptée à <ï>) telle que : 

$(e/, e,) = 0 pouri^j, 

&(e h e t )— 1 pourl ^ i < p, 

= — 1 pour/? + 1 < i < n = dim E, 

et le nombre p est le même pour toutes les 
bases adaptées (« loi d’inertie ») ; on dit 
que (p , H —p) est la signature de $ ; un 
produit scalaire est donc une forme de 
signature ( n , 0). 

La différence fondamentale entre le 
cas 1 < p < n et les cas p = n et p = 0 
réside dans l’existence de vecteurs x ^ 0 
tels que <ï>(x, x) = 0 , dits vecteurs isotropes 
(leur ensemble est appelé cône isotrope 
de E). Plus généralement, il y a des 
sous-espaces V 7 ^ {0} tels que la restric- 
tion de $à V soit identiquement nulle ; 
on dit que ces espaces sont totale- 
ment isotropes et leur dimension maximale 
est : 


v = sup (p, n —p), 

appelée indice de Witt de <f>. On définit 
comme dans le chapitre 2 les notions de 
vecteurs orthogonaux (pour <|>) et de SOUS- 
espaces orthogonaux ; on a encore entre V 
et son orthogonal V 1 les mêmes rela- 
tions, sauf les relations (équivalentes) 
VHV i = {0} e t V + V i =E;s i 
vnv 1 # { 0 }, on dit que Y est un SOUS- 
espace isotrope. Dire que V C V 1 signifie 
que V est totalement isotrope ; pour tout 
sous-espace V, V il V 1 est totalement iso- 
trope et c’est, en fait, le plus grand 
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sous -espace totalement isotrope contenu 
dans V ou V 1 . 

Ces notions d’« orthogonalité » relati- 
ves à 4> ont une traduction plus familière 
(tout au moins pour n = 4) en géométrie 
projective : si P(E) est l’espace projectif 
(de dimension n 1) associé à E, l’image 
Q dans P(E) du cône isotrope d’équation 
<£>(*, x) = 0 est appelée quadrique (ou 
hyperquudrique) projective non dégéné- 
rée ; si x et y sont deux vecteurs # 0 dans 
E, orthogonaux pour <£, on dit que les 
images de R,y et Ry sont des points de 
P(E) conjugués par rapport à Q. Si D est 
une droite de E et H = D 1 Fhyper- 
plan orthogonal pour <I>, on dit que le 
point de P(E) correspondant à D est le 
pôle de I’hyperplan projectif correspon- 
dant à H et que ce dernier est Yhyperplan 
polaire de ce point (par rapport à Q). Un 
sous-espace isotrope de E a pour image 
une variété projective tangente à Q et un 
sous-espace totalement isotrope a pour 
image une variété projective contenue 
dans Q (de dimension projective v 1 ; 
pour n = 4, v = 2, ce sont les génératrice 
de Q). 

On définit les similitudes et les transfor- 
mutions orthogonales relatives à <I> en 
remplaçant, dans les définitions du chapi- 
tre 2, le produit scalaire par <î>(x, y) ; on 
note GO(@) [resp. 0(4»)] le groupe des 
similitudes [resp. le groupe orthogonal] 
relatif à <J> ; on a GO(- <f>) = GO(4>). La 
loi d’inertie montre que le multiplicateur 
JLl(w) d’une similitude est nécessairement 
> 0 sauf si n est pair etp — njl ; sauf dans 
ce dernier cas, GO(@) est produit direct de 
0(<î>) et de Z + (E) ; si p — njl, ce produit 
direct est un sous-groupe d’indice 2 (non 
facteur direct) dans GO(@). 

Si on rapporte E à une base adé- 
quate pour la matrice JJ d’une simili- 


tude relative à <I> est caractérisée par la 
relation : 

X U .D . U = pZ>, 

où : 

D = diacj (1, .... I — 1, ... . 1) ; 

P n ~P 

on a donc (det U) 2 = p", et en particulier, 
det U = ± 1 pour une transformation 
orthogonale ; on définit comme dans le 
chapitre 2 le groupe des rotations 0 + (4>) ; 
sauf lorsque n est pair et p = nj 2, on dit 
que le sous-groupe d’indice 2 dans GO(@), 

GO +(+) = 0 + (0) X Z+(E), 

est formé de similitudes directes (les autres 
étant dites inverses). Pour n = 2 p, le 
groupe GO+(@) des similitudes directes 
est défini comme formé des similitudes u 
telles que det(w) = (\x(u)Y ; il contient le 
produit direct précédent, qui en est un 
sous-groupe d’indice 2. 

Le groupe 0(4») relatif au cas n = 4, 
p - 3 joue un rôle fondamental en relati- 
vité restreinte et est connu sous le nom de 
groupe de Lorentz (le cône isotrope étant 
alors souvent appelé « cône de lumière »). 

Nous supposons dans tout ce qui suit 
que 1 ^ p ^ n 1 ; on peut d’ailleurs 
supposer p ^ njl pour l’étude de GO(@). 

Générateurs de 0(<ï>) 

Les dévolutions de 0(4») se caractérisent 
comme ci-dessus (cf. Générateurs du 
groupe orthogonal, in chap. 2) ; mais, 
comme V + et V - doivent être orthogonaux 
et tels que V + + V~ = E, ce sont néces- 
sairement des espaces non isotropes. Si 
n = dim E, il est encore exact que toute 
transformation orthogonale est produit de 
n réflexions orthogonales au plus et que 
toute rotation est produit d’un nombre fini 
de renversements. Le centre Z 0 de 0(4») 
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est le même que dans le cas euclidien, et on 
a Z 0 C 0+(<ï>) si n est pair, 0(4») = 
Z 0 X 0 + (<ï>) si n est impair. 

Propriétés de transitivité 

Les propriétés de transitivité sont très 
différentes du cas euclidien. Pour un SOUS- 
espace V de E, de dimension m , on 
considère le sous-espace totalement iso- 
trope V Pi V 1 de dimension r ^ m, puis un 
supplémentaire W de V fl V 1 dans V ; la 
restriction de <!> à W est non dégénérée, 
soit (q,m — r —■ q) sa signature. On a ainsi 
attaché trois invariants numériques m, r et 
q au sous-espace V ; étant donné deux 
sous-espaces Vj, V 2 de E, pour qu’il existe 
une transformation orthogonale u telle que 
w(Vj) = V 2 , il faut et il suffit que ces trois 
entiers soient les mêmes pour V, et \f>. 
Lorsqu’il en est ainsi, il existe même une 
rotation u telle que w(Vi) = V 2 , sauf dans 
un cas, celui où n est pair, <ï> de signature 
(n/ 2 , nj 2 ) et où il s’agit de sous-espaces 
totalement isotropes de dimension maxi- 
male n/ 2. En effet, il existe deus classes 
d’intransitivité n„ n 2 de ces sous-espaces, 
pour l’action du groupe 0 + (<î>) ; dans 
l’interprétation projective, ce sont les 
variétés projectives de dimension ni 2 — 1 
contenues dans la quadrique Q de dimen- 
sion n — 1 et pour fj = 4, on retrouve les 
deux systèmes de génératrices classiques. 
Si V, Y’ sont deux sous-espaces totalement 
isotropes de dimension n/2 , dim (V H V’) 
a même parité que n/2 si V et V’ appar- 
tiennent à la même classe d’intransitivité 
n, (i = 1, 2), une parité opposée à celle de 
n/2 dans le cas contraire. 

Le groupe 0(4>) pour n = 2 

Le seul cas à considérer est celui de la 
signature (1, 1) : E, muni de <ï>, est alors 
appelé plan hyperbolique. Il y a deux 


droites isotropes Dj, Do dans E ; une base 
(a h a 2 ) de E telle que E D h a 2 E D 2 et 
$(&!, a 2 ) = 1 est dite base isotrope de E. 
Par rapport à une telle base, la matrice 
d’une similitude a l’une des deux for- 
mes : 

= J ) 1 U >-(1 o )’ x ^ a 

Les matrices U j (resp. [/ 2 ) sont celles 
des similitudes directes (resp. inverses) ; 
elles laissent invariantes chacune des droi- 
tes isotropes (resp. les échangent). Le 
groupe GO+(@) est donc encore commu- 
tatif, ’ mais isomorphe au produit 

R * X R * ; il opère, dans ce cas, 
de façon simplement transitive dans 
R 2 - (Dj u D 2 ), et le sous-anneau qu’il 
engendre dans M,(R) est isomorphe à 
R X R. Le groupe 0 + (^>) est formé des 
matrices JJ j telles que Àp = 1 et est 
isomorphe au groupe multiplicatif R * ; 
il contient donc un sous-groupe d’in- 
dice 2, 0 + +(<ï>), dit groupe des rota- 
tions orthochrones , correspondant aux 
matrices pour lesquelles A > 0 et isomor- 
phe à Rî. On a par suite un isomorphisme 
bicontinu : 


du groupe additif R sur le groupe 
0 ++ (4>). Ce dernier opère de façon sim- 
plement transitive dans chacun des quatre 
« quadrants » ouverts déterminés dans R 2 
par les droites Dj, D->. Si A et A’ sont deux 
demi-droites contenues dans l’un d’eux 
(par exemple celui défini par > 0. 
ç 2 > 0) la rotation orthochrone u telle que 
u(A) = A’ correspond à un nombre X > 0 
tel que = (DjD 2 DD'), birapport de 
Dj, de D 2 et des droites D, D’ contenant 
A, A’ ; on est donc conduit ici à appeler 
« angle hyperbolique » (a% A'') d’un vecteur 
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X E A et d’un vecteur .y' E A’ le nombre 
réel : 

iln(D,D 2 DD'); 

on a encore la relation : 

( X , X ") = (x, X ‘) + (x \ X ") 

pour trois vecteurs du même quadrant. Si 
on rapporte R 2 à une base adaptée, la 
matrice correspondant au nombre t 
s’écrit : 

f ch t sh t\ 

\ sh t ch t) 

et les traductions du fait que l’application 
de R sur 0 + +(<!>) définie ainsi est un 
homomorphisme donnent cette fois les 
formules de la « trigonométrie hyperboli- 
que ». 

Les groupes 0+(Q) pour n ^ 3 

La description générale des rotations, en 
raison de l’existence des vecteurs isotro- 
pes, est ici beaucoup plus compliquée que 
celle donnée plus haut (cf. Structure des 
transformations orthogonales , in chap. 2) 
pour le cas euclidien, et nous ne l’indique- 
rons pas. 

Le groupe des commutateurs de ow 
est ici un sous-groupe d’indice 2 de 0 + (4>), 
qu’on appelle encore le groupe orthochrone 
et qu’on note 0 ++ (^>) ; si l’on écrit : 



une matrice de 0 + (<î>) par rapport à une 
base adaptée, X étant d’ordre /?, le groupe 
0 ++ (4>) est formé des matrices pour 
lesquelles det(A) > 0 . On a Z 0 C 0 ++ (<ï>) 
si p et n— p sont pairs, 

0 + (4>) = Z 0 x 0 +_t_ (4s)i n est pair et p 
impair. 


On peut encore prouver que le groupe 
o++(<t>)/(Z 0 n o++(*)) est simple pour 
U = 3 et n ^ 5 ainsi que pour n = 4 et 
p = 1 ou p = 3 ; par contre, O ++ (<ï>)/Z 0 
est produit direct de deux groupes simples 
pour n = 4 et p = 2. Les méthodes sont 
ici tout à fait différentes de celles qui sont 
employées dans le cas euclidien. 

Géométries non euclidiennes 
Soit <î> une forme bilinéaire symétrique de 
signature (n — 1 , 1) sur E, et soit F la partie 
de l’espace projectif P(E) correspondant 
aux vecteurs x E E tels que <î>(x, x) < 0 ; il 
résulte de la loi d’inertie que le groupe 
0(4>) opère transitivement sur F, et y 
définit donc une «géométrie » qu’on 
appelle géométrie non euclidienne hyperbo- 
lique (en dimension n — 1) ; une variété 
linéaire non euclidienne de dimension 
m ^ n — 1 est, par définition, l’intersec- 
tion de F et d’une variété linéaire projec- 
tive de dimension m qui rencontre F. Le 
groupe 0(d>) opère alors encore transiti- 
vement sur les variétés linéaires non eucli- 
diennes de dimension donnée m ; cela 
résulte des propriétés de transitivité (cf. 
Propriétés de transitivité , in chap. 3) et de 
l’hypothèse p = n l (la propriété analo- 
gue serait inexacte pour m ^ 0 et pour 
m 7^ n 1 si l’on prenait n/2 ^ p ^ n — 
2). La quadrique Q est qualifiée d’« ab- 
solu » de l’espace non euclidien F ; elle n’y 
est évidemment pas contenue, mais donne 
un moyen commode d’étudier les proprié- 
tés de l’espace non euclidien F. Par exem- 
ple, comme deux plans de E peuvent 
rencontrer F et avoir une intersection qui 
soit une droite Rx avec q>(x, x) > 0, 
l’existence d’une infinité de droites non 
euclidiennes passant par un point A, conte- 
nues dans le plan non euclidien déterminé 
par A et une droite D, et ne rencontrantpas 
D (dans F) est immédiate. De même, 
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l’étude faite plus haut (cf. Le groupe 0(4») 
pour n — 2, in chap. 3) conduit à définir la 
distance non euclidienne de deux points A, 
et A, de F comme suit. On considère les 
deux points I et Y où la droite non 
euclidienne AjA 2 rencontre Q, et on prend 
pour distance de A, et de A 2 le nombre 

ln(irAiA 2 ) |, à un facteur près. Enfin, 
soit Dj et D 2 deux droites non euclidiennes 
passant par un même point A de F ; si L 
est la droite de E correspondant à A. D, 
et D 2 correspondent à deux plans P, et 
de E contenant L ; par la loi d’inertie, la 
restriction de <î> à I’hyperplan H orthogo- 
nal à L est positive non dégénérée, autre- 
ment dit H est un espace euclidien de 
dimension n ^ 1 ; si et x> sont deux 
vecteurs de longueur 1 orthogonaux à L 
dans P, et P 2 respectivement, l’angle (jc l; 
X 2 ) a donc un sens, et c’est par définition 
Y ang le (non euclidien) des « vecteurs » 
AM j et AM-» si M, et correspondent à 
Ra) et à Ra 2 dans P(E). 

L’espace non euclidien F défini 
ci-dessus est encore appelé modèle de 
Cayley de la géométrie non euclidienne 
hyperbolique. Comme p = 1, F est en 
correspondance biunivoque canonique 
avec la boule unité ouverte B de R"” 1 , à 
tout point A' G B correspondant l’image 
dans F de la droite R(a + e,) de E = R /r ; 
en transportant le modèle de Cayley par 
cette correspondance, on obtient le modèle 
de Belîrami , géométrie définie dans B, ou 
F« absolu » est la sphère unité S définie par 

L’application : 

2x 

X ~l+lx\\> 

est une bijection de la boule B sur elle- 
même, qui transforme les hyperplans de 

R n\ 

rencontrant B en les sphères « ortho- 
gonales » à la sphère S. En transformant le 


modèle de Behrami par cette transforma- 
tion, on obtient le modèle de Klein-PoinCüïé 
de la géométrie non euclidienne hyperbo- 
lique, où les « hyperplans non euclidiens » 
sont les traces sur B des sphères « ortho- 
gonales » à S (y compris les hyperplans 
diamétraux de S) ; l’intérêt de ce modèle est 
que l’angle de deux « droites non euclidien- 
nes » (c’est-à-dire dans le modèle, deux 
cercles « orthogonaux » à S) est l’angle 
euclidien des tangentes à ces deux cercles en 
leur point commun. En transformant 
encore par une inversion de pôle situé sur 
S, on obtient comme modèle le demi-espace 
de Poincaré , ensemble des A' G R" - ' 1 tels 
que £ n _j > 0, où les hyperplans non eucli- 
diens sont les demi-sphères de centre dans 
l’hyperplan H défini par = 0 et les 

hyperplans perpendiculaires à H. 

Il y a une autre géométrie « non eucli- 
dienne » classique, la géométrie elliptique 
de Riemann-Klein ; ici, on prend pour <J> 
une forme bilinéaire symétrique de signa- 
ture (n, 0) (autrement dit, le produit sca- 
laire euclidien dans E), et F = P(E), les 
variétés linéaires non euclidiennes étant ici 
simplement les variétés linéaires projecti- 
ves ; il n’y a donc pas ici de « droites 
parallèles » non confondues et le groupe 
de la géométrie est 0(n, R). La notion 
d’angle (non euclidien) se définit comme 
dans la géométrie hyperbolique ; quant à la 
distance non euclidienne de deux points A, 
et A 2 , on la définit comme la « mesure » en 
radians comprise entre 0 et tt/ 2 de l’angle 
(euclidien) de deux vecteurs Xj et AS 
correspondant respectivement à A, et à 
A 2 . 

4. Généralisations 

Les groupes GL(E) et SL(E) se définissent 
de la même manière lorsque E est un 
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espace vectoriel de dimension finie sur un 
corps commutatif K quelconque ; si 
n = dim E, on note aussi ces groupes 
GL(/7, K) et SL(fl, K). Tout ce qui a été vu 
dans le chapitre 1 pour le cas K = R 
s’étend sans changement au cas général, 
sauf en ce qui concerne la détermination 
des involutions lorsque K est de caracté- 
ristique 2 et, en ce qui concerne les 
propriétés de conjugaison, lorsque 
dim E = 2. On peut toutefois montrer que 
SL(E) est encore son propre groupe des 
commutateurs sauf lorsque dim E = 2 et 
que K est un corps fini ayant deux ou trois 
éléments ; la démonstration de simplicité 
faite plus haut dans le chapitre 1 s’applique 
alors sans modification et prouve que 
SL(E)/(Z H SL(E)) est un groupe simple, 
sauf dans les deux cas précédents. 

On peut étendre la définition de GL(E) 
et de SL(E) au cas où E est un espace 
vectoriel (à gauche) de dimension finie sur 
un corps K non commutatif, mais il faut 
utiliser dans ce cas une autre définition du 
déterminant ; moyennant quoi, on peut 
encore prouver la simplicité du groupe 
SL(E)/(Z fl SL(E)) ; le centre Z(E) de 
GL(E) est ici formé des homothéties 
x i — * \x où A #0 est dans le centre de K. 

La définition de GL(E) est aussi valable 
pour un module (à gauche) E sur un 
anneau quelconque A ; mais, ici, la struc- 
ture de ce groupe dépend de façon essen- 
tielle de la structure de l’anneau A, et on 
ne connaît de résultats satisfaisants que 
dans un petit nombre de cas particuliers. 

La notion de groupe orthogonal 0(T>) 
se généralise aussi au cas où E est un 
espace vectoriel de dimension finie sur un 
corps commutatif K, que nous suppose- 
rons en outre de caractéristique =£ 2 ( la 
caractéristique 2 introduit ici des phéno- 
mènes spéciaux) ; est une forme bili- 
néaire symétrique non dégénérée sur E. Il 


faut remarquer d’abord qu’il y a toujours 
ici des bases orthogonales (e,) de E pour la 
forme c’est-àdire <ï>(e ; , e,) = 0 pour 
i ^ j ; mais, si l’on pose 4>(<?„ e i) = a„ ü 
n’est pas possible en général d’obtenir une 
base orthogonale pour laquelle oq = ± 1 
pour tout i ; la notion de signature de 4> n’a 
pas de sens lorsque K n’est pas un corps 
ordonné. Par contre, la définition des 
vecteurs et sous-espaces isotropes subsiste 
sans modification ; on appelle encore 
indice de Witt de <ï> la dimension maximale 
V des sous-espaces totalement isotropes, et 
on a 2 V ^ fl. Il faut noter que, lorsque K 
est algébriquement clos (par exemple 
K = C), on a toujours V = [n/2], partie 
entière de n / 2 ; si K est fini, on a v = [n/ 2] 
pour n impair, v = nj 2 ou nj 2 — 1 si n est 
pair. 

Tout ce qui a été dit dans le chapitre 3 
sur les involutions de 0 ( 4 ») subsiste sans 
changement dans le cas général. Les ques- 
tions de transitivité sont résolues par le 
théorème de Witt : Soit deux sous-espaces 
vectoriels V, et V 2 de même dimension 
dans E, pour qu’il existe une transforma- 
tion u 6E 0(4>) telle que «(Vj) = V 2 , il faut 
et il suffit que les restrictions de 4* à Vi et 
à V 2 soient des formes équivalentes (dégé- 
nérées ou non). On peut encore alors 
transformer Vj en V 2 par une rotation, sauf 
dans le même cas d’exception que pour 
K = R (cf. Propriétés de transitivité, in 
chap. 3). 

Le groupe 0 + (4>) est encore commu- 
tatif pour n — 2 ; il est formé des matrices : 



telles que a^ 2 + a 2 f| 2 = a, ; si — a 2 /cx ( 
n’est pas un carré dans K, ce groupe est 
isomorphe au groupe multiplicatif des 
éléments de norme 1 dans l’extension 
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quadratique K(V- C^/^l ) de K ; sinon, il 
est isomorphe à K * X K *. 

Il n’y a rien d’analogue en général à la 
prétendue « mesure » des angles ; autre- 
ment dit, il n’existe pas en général d’homo- 
morphisme du groupe additif de K sur le 
groupe des rotations 0 + (<t>). 

Lorsque n ^ 3, il faut distinguer, dans 
l’étude de la structure du groupe 
le cas v > 1 et le cas v = 0 . 

Pour v 1 (autrement dit, lorsqu’il 
existe des vecteurs isotropes ^ 0 ), on 
considère le groupe □(<£) C 0 + (<ï>) des 
commutateurs de 0(<ï>). Le quotient 
O + ($)/Q(<&) est isomorphe à K*/K* 2 , en 
désignant par K * 2 le groupe des carrés des 
éléments ^ 0 de K ; si n est pair, le groupe 
Q(<D) n Z 0 est égal à Z 0 si et seulement si 
le discriminant de 4> est un carré dans K. 
Le groupe : 

£W(i pwnz 0 ) 

est simple pour n ^ 5. Pour n = 3, Q(<ï>) 
est isomorphe à SL(E)/Zq, donc simple 
sauf si K a trois éléments ; pour n = 4 et 
V = 1, le discriminant A de 3> ne peut être 
un carré dans K ; Q(4>) est alors simple et 
isomorphe à SL(F), où F est un espace 
vectoriel de dimension 2 sur K^A/Â). 
Enfin, pour n = 4 et v = 2, le groupe : 

Q(<F)/(Q(<I>) n Z 0 ) 
est isomorphe au produit : 

(SL(E)/Z 0 ) X (SL(E)/Z 0 ), 

dont les facteurs sont simples si K ^ F 3 . 

Le cas v = 0 (absence de vecteurs 
isotropes ^ 0 ) est tout à fait différent, et 
la structure de 0 (<F) dépend essentielle- 
ment du corps de base K. Prenons par 
exemple n = 3 et. pour le produit 
scalaire usuel : 

= Mi + M2 + 


mais sur le corps Q des nombres rationnels ; 
les matrices U = (a,) ont donc leurs 
éléments rationnels, vérifiant en particulier 
les équations : 

a/ + aj + a] = 1, 

pour i = 1,2, 3. Or, pour toute solution de 
l’équation : 

r\ + r\ + r\ = 1 

en nombres rationnels (supposés réduits 
en fractions irréductibles), le dénomina- 
teur de chaque r t n est pas divisible par 2. 
Supposons en effet le contraire : on voit 
alors aussitôt qu’on aurait une relation de 
la forme : 

ml 2 lk =p\ +pl+pl, 

ou k est un entier >0, fît un entier impair, 
P\, /? 2 , 773 des entiers dont l’un au moins est 
impair ; mais il est immédiat de vérifier 
que, dans ces conditions, la somme 
p\ + P 2 + Pi n est jamais multiple de 4, 
d’où notre assertion. 

Cela étant, pour tout entier r ^ 1, soit 
G, le sous-groupe de formé des 

matrices de la forme / -f- 2' K, où V est une 
matrice à coefficients rationnels dont 
les dénominateurs ne sont pas divisibles 
par 2. Pour toute matrice U G 0( < l ) ), on a 
alors : 

U{I + V V ) 17—1 e G, 

en vertu de ce qui précède. Par suite, 
chaque G r est un sous-groupe distingué 
de Of^) ; on montre qu’ils sont tous 
différents et forment une suite descen- 
dante : 

0(4>)DG 1 3G 2 D...DG,D... 

Si K = Q, le phénomène précédent ne 
peut se produire que pour les dimensions 
3 et 4 ; mais on peut, pour toute valeur de 
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il, donner des exemples de corps K et de 
forme <ï> pour lequel on a une suite infinie 
décroissante de sous-groupes distingués de 

O(fc). 


5. Groupes symplectiques 
et groupes unitaires 

Deux autres types de groupes « classi- 
ques » ont été étudiés depuis le milieu du 
XIX e siècle. Si E est un espace vectoriel 
sur un corps (commutatif) K de dimen- 
sion finie n, une forme bilinéaire alternée 
<ï> sur E ne peut être non dégénérée que 
si n = 2 v est pair. Il existe alors une 
base : 

(«/). 1 < / < 2v t 

de E (dite base symplectique ) telle que : 

+ v) = 1, 

pour 1 ^ ^ V, et : 

4>(e,. e } ) = 0, 

pour tout autre couple d’indices, de sorte 
que l’on a : 

t>(x, y ) = ^ (ç,n,+v— Çf+vi,); 

i = l 

toutes les formes alternées non dégénérées 
sont équivalentes. On appelle groupe sym- 
plectique (sur K) et on note Sp(2v, K) le 
sous-groupe formé des u E GL(E) tels 
que : 

u (y)) = <&(x,y\ 

pour x, y dans E. 

Considérons maintenant un corps K 
(non nécessairement commutatif) muni 
d’une involution : 


distincte de l’identité, c’est-a-dire une bijec- 
tion de K sur lui-même telle que : 

£** = ç, (ç + n)* = £* + n*, 

(en)*=n*£*. i* = i ; 

soit E un espace vectoriel à gauche de 
dimension finie sur K, et soit <|> une forme 
hermitienne non dégénérée sur E (pour 
l’ involution donnée) ; le groupe u(<r>) des 
u E GL(E) tels que : 

$(tt(x),tt(y)) = $(x,y), 

pour x, y dans E est appelé le groupe 
unitaire relatif à <î>. Lorsque K est 
commutatif, les u E U(4>) tels que 
(det u)(det w)* = 1 forment un sous- 
groupe distingué U + (4>), ou SU(@), dit 
groupe spécial unitaire. 

Pour le groupe symplectique et pour le 
groupe unitaire, les définitions des vecteurs 
et des sous-espaces orthogonaux, des SOUS- 
espaces totalement isotropes, des SOUS- 
espaces isotropes et de l’indice de Witt 
sont les mêmes que dans le chapitre 4. 
Pour le groupe symplectique, tout vecteur 
est isotrope et l’indice de Witt est n/2 \ les 
transvections (cf. Générateurs, in chap. 1) 
appartenant à Sp(2 v, K) sont celles pour 
lesquelles l’hyperplan H de la transvection 
(toujours isotrope) est orthogonal à la 
droite D de la transvection ; les transvec- 
tions symplectiques engendrent Sp(2 v, 
K), donc det(w) = 1 pour tout u E Sp(2 V, 
K). Le centre de Sp(2 v, K) est Z 0 . Pour 
p premier, désignons par F p le corps fini 
des entiers relatifs modulo p. Le groupe 
Sp(2 v, K)/Z 0 est simple pour v 1 , sauf 
lorsque v = 1 et K = F 2 ou K — F 2 , et 
lorsque v = 2 et K = F 7 ; dans ce dernier 
cas, Sp(4, F 2 )/Zq est isomorphe au groupe 
symétrique Z 6 . Pour v = 1. Sp(2, K) = 
SL(2, K). 

Lorsque n = 4, les plans totalement 
isotropes de E correspondent, dans 
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l’espace projectif P(E), aux droites d’un 
complexe linéaire, et le groupe Sp(4, K)/Z 0 
est le groupe qui laisse ce complexe inva- 
riant, d’où son nom. 

Pour les groupes unitaires, on a v ^ 
n/ 2, mais v peut prendre toutes les valeurs 
entières remplissant cette condition. Pour 
v > 0, il existe dans U(<ï>) des transvec- 
tions dont I’hyperplan H est nécessaire- 
ment isotrope et la droite D est orthogo- 
nale à H. Ces transvections engendrent un 
sous-groupe distingué T(4>) de U(<I>) dont 
le centre W(4>) est égal à T(4>) H Z(E) ; le 
groupe T(4>)/W(<ï>) est simple, sauf lorsque 
K = F 9 et n — 2, ou lorsque K = F 4 , 

U = 2 et n = 3 ; T(<î>), pour n = 2 et K 
commutatif, s’identifie à SL(2, K,), 
où Kq est le sous-corps des invariants de 
l’involution de K. Lorsque K est commu- 
tatif, on a T(<ï>) = U + (<ï>), sauf lorsque 
n = 3 et K — F 4 . Lorsque v ^ 2, ou 
lorsque n ^ 3 et que K est de rang fini 
sur son centre, T(4>) est le groupe des 
commutateurs de U(<ï>) ; par contre, 
pour n = 2, il y a des corps non commu- 
tatifs de rang 4 sur leur centre tels que 
T(<ï>) ne soit pas le groupe des commuta- 
teurs de U(4>), le quotient U(4>)/T(4>) 
pouvant avoir des facteurs de composi- 
tion simples (non commutatifs). Pour 
v = 0, les mêmes phénomènes que 
pour les groupes orthogonaux peuvent se 
produire. 

JEAN DIEUDONNÉ 
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C. Groupes finis 

Née de l’étude des groupes de permuta- 
tions des racines d’équations, la théorie des 
groupes finis s’est développée indépen- 
damment depuis le Traité des substitutions 
et des équations algébriques (1870) de 
Camille Jordan. Après les travaux impor- 
tants de Burnside, de Frobenius et de leurs 
élèves vers le commencement du XX e siècle, 
cette théorie connut une période de déve- 
loppement lent, faute de méthodes pour 
résoudre les nombreux problèmes posés 
par ces pionniers. Les efforts de mathé- 
maticiens comme P. Hall et R. Brauer 
pendant cette période ont engendré les 
nouvelles méthodes qui, après 1955, ont 
amené une intense activité dans ce 
domaine ; des progrès énormes ont été 
accomplis, particulièrement dans la théo- 
rie des groupes simples et la théorie des 
relations entre un groupe et ses sous- 
groupes. Mais beaucoup de questions sont 
restées longtemps ouvertes et sont l’objet 
d’une recherche acharnée. 


1. Groupes de permutations 

Historiquement la théorie des groupes finis 
commença avec l’étude des groupes symé- 
triques et de leurs sous-groupes, les grou- 
pes de permutations. Soit E un ensemble 
fini formé des n éléments e [y . . . . e )V U ^ 1. 
Une permutation n des éléments . . . . e n 
(ou encore une permutation tt sur E) est 
une application x >— 1 * 7T(a) de E dans E, telle 
que chaque élément y de E soit l’image 
y = tt(y) d’un élément unique x de E. 
L’application tt - 1 , envoyant chaque élé- 
ment y sur l’élément x tel que y — 7T(x), est 
alors aussi une permutation sur E, qui 
s’appelle l’inverse de tt. Le produit irp de 
deux permutations TT, p sur E est la 
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permutation de . . . . e n définie par : TTp(.v) 

7T(p(jc)), pour tout x dans E. Avec ces 
définitions de l’inversion et de la multipli- 
cation, l’ensemble des permutations sur E 
forme un groupe fini C(E), le groupe 
symétrique de E. Son élément neutre est la 
permutation identité 1 = 1 E sur E, qui 
envoie chaque x = £j, e„ sur lui-même : 
1 e (.y) = x. 

Le groupe symétrique C(E) est déter- 
miné à un isomorphisme près par le 
nombre n — E d’éléments de E ; et on 
l’appelle souvent le groupe symétrique E /( 
de degré n , sans spécifier l’ensemble E. 
L’ordre L /7 du groupe E n , c’est-a-dire le 
nombre de ses éléments, est n ! = 1.2... 
(n — 1 ).n. 

On peut représenter une permutation TT 
de éq, .... e n graphiquement par un tableau 
formé des éléments e„ et de flèches. 

Chaque flèche joint un élément x = e\, . . . . 
e,, à son image y = 7T(x). Par exemple, si 
7T est la permutation des éléments a , b, t\ 
d, définie par ir(a) = c, r(b) = a, 
n(c) = t/, Tï(d) = b, son tableau est : 

a~+c 

\ 

b - d 

Une permutation comme celle-ci, dont 
le tableau a la forme d’une seule boucle, 
s’appelle une permutation cyclique. Elle se 
note en donnant les éléments dans leur 
ordre cyclique TT = ( a , c\ d, b). Dans cette 
écriture, on peut commencer avec 
n’importe quel élément et écrire TT sous les 
formes équivalentes : 

tt = (a, c, d,b) = (c, d, b , a) 

= (d, b, a, c) = (b, a, c, d). 

Toute permutation sur E s’écrit 
comme un produit de permutations cycli- 
ques sur certains sous-ensembles de E. 
Ainsi, la permutation 7T de 1, 2, .... 6 


définie par : 7r(l) = 5, 7T(2) = 6, 7r(3) = 
3, 7r(4) = 2, 7r(5) = 1, ir(6) = 4, a pour 
tableau 

2 - 6 

105 \ / 3^5 

4 

Il est évident que l’ensemble {1,2,.... 
6} se décompose en une réunion disjointe 
des sous-ensembles { 1, 5], {2, 6 ? 4) et {3}, 
sur lesquels jf opère comme les permuta- 
tions cycliques (1, 5) (2, 6, 4) et (3). Ces 
permutations cyhques sont les cycles de tt. 
La longueur d’un cycle de 7 r est le nombre 
d’éléments dans le sous-ensemble corres- 
pondant. Donc TT a des cycles de longueur 
2, 3 et 1. On écrit 7 r comme le produit 
(dans n’importe quel ordre) de ses cycles : 
1T= (1, 5)(2, 6, 4) (3) = (4, 2. 6)(3)(1, 5) 

On a l’habitude de supprimer les cycles 
de longueur 1 quand l’ensemble E est 
connu. On écrit ainsi (1, 5)(2, 6, 4) au lieu 
de (1, 5)(2, 6, 4)(3) pour la permutation 
considérée précédemment. Cette notation 
est cohérente avec la notation adoptée 
pour la multiplication, car la permutation 

(1, 5)(2, 6, 4) = (1, 5)(2, 6, 4)(3) est en fait 
le produit des permutations (1, 5) = (1, 

5)(2)(3)(4)(6) et ( 2 , 6, 4 ) = (2, 6, 
4X 1X3X5). 

Si les longueurs des cycles d’une per- 
mutation tt sont /j, . . . . l k alors la signature 
sgn(Tr) rie JT est le nombre : 

(1) sgn(7r) = ( — l)(h ) +/*) + *• 

donc la signature de (1. 5)(2, 6, 4) est 
(_ l)(2+3)+2 „ _ , 

Si cette signature est égale à 1, la 
permutation TT est paire , si elle est égale à 

1, elle est impaire . La fonction sgn est 
une fonction multiplicative : sgn(7Tp) 
sr sgn(ir)sgn(p), pour toutes les permuta- 
tions 7T et p. L’application 7T ► Sgn(7T) est 
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donc un morphisme surjectif du groupe L n 
sur le groupe multiplicatif des nombres 
± 1 (si n ^ 2). Le noyau de ce morphisme, 
c’est-à-dire l’ensemble A,„ des permuta- 
tions paires de Y. n est alors un sous-groupe 
distingué de L /r C’est le groupe alterné de 
degré n . Son ordre est A„ | = W !/2. 

Les groupes 7b n et A, sont des exemples 
de groupes de permutations. Un tel groupe 
G sur un ensemble E est un sous-groupe 
quelconque du groupe symétrique C(E). 
Le degré, deg G, de G est alors le nombre 
E d’éléments dans E. Son ordre G est le 
nombre de ses éléments. 

A chaque élément X de E on associe son 
stabilisateur G v , le sous-groupe de toutes 
les permutations tt dans G envoyant x sur 
lui-même : 7T(x) = x. 

Si, pour tout couple (.y, y ! ) d’éléments 
distincts de E, il existe au moins une 
permutation 7T dans G telle que ît(a') = y, 
on dit que le groupe G est transit. $ Par 
exemple, le groupe alterné A„ est transitif 
pour ri ^ 3 : si x et y sont deux éléments 
distincts de E, il existe un élément z de E, 
distinct de x et de y. La permutation (x, y, 
z) est paire, d’après (1), et envoie x sur y. 

On a déjà décomposé une permutation 
TT sur un ensemble E en permutations 
cycliques sur certains sous-ensembles dis- 
joints de E. De manière analogue, on peut 
décomposer un groupe G de permutations 
sur E en groupes transitifs de permutations 
sur certains sous-ensembles disjoints de E. 
À tout élément x de E, on associe sa 
G-orbite G(s), qui est l’ensemble de toutes 
les images 7T(x) de x par les permutations 
TT de G. L’élément x = l(s) appartient à 
son orbite G(x), et, pour tout élément y G 
G(x), on a G(y) = G(x). L’ensemble E est 
donc la réunion disjointe des G-orbites E„ 

E^. de ses éléments. Si une permutation 
TT appartient à G, sa restriction 7q est une 
permutation sur l’orbite E„ pour i = 1, . . . . 


k. Ces restrictions TTj, . . . . 7T^ déterminent la 
permutation TT. L’ensemble G, des restric- 
tions tq (à E,) des permutations TT de G est 
un groupe transitif de permutations sur E„ 
i = 1, k ; et l’application tt tt,- est un 
morphisme surjectif du groupe G sur G,. 
On a donc analysé le groupe G en les 
groupes transitifs G„ .... G* au moyen des 
morphismes TT l ”~* 7 q. 

La famille des groupes transitifs de 
permutations est universelle, en ce sens que 
chaque groupe fini H est isomorphe à un 
groupe G de cette famille. En effet, chaque 
élément a de H détermine une permuta- 
tion 7 T a des éléments de H, définie par 
7T a (l) = (JT, pour tout T de H. L’applica- 
tion o- 7T a est un isomorphisme du 
groupe H sur un groupe transitif G de 
permutations sur H. Le groupe G ainsi 
obtenu a la propriété suivante : Si une 
permutation tt de G laisse invariant au 
moins un élément de l’ensemble sur lequel 
G opère, alors TT = 1. On appelle régulier 
tout groupe transitif de permutations 
ayant cette propriété. Tout groupe régulier 
G de permutations s’obtient à partir d’un 
groupe abstrait H de la manière décrite 
plus haut. 

Comme la famille des groupes transitifs 
de permutations est universelle, il ne peut 
être question de les classer tous. On peut 
pourtant essayer de classer certaines SOUS- 
familles importantes de ces groupes. Une 
de ces sous-familles est celle des groupes de 
Frohenius. Un tel groupe G est un groupe 
transitif, mais non régulier, de permuta- 
tions sur un ensemble E, avec la propriété 
suivante : Si une permutation TT dans G 
laisse invariants au moins deux éléments 
de E, alors Frobenius a montré (en 

1901) qu’un groupe de Frobenius a tou- 
jours un unique sous-groupe régulier dis- 
tingué K, appelé noyau de Frohenius de G, 
tel que G = G V K et G v fl K = { 1 } pour 
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tout stabilisateur G v d’un élément .Y dans 
E. En 1936, Zassenhaus a donné une 
classification complète des stabilisateurs 
G v des groupes de Frobenius. Il n’y a pas 
de classification complète des noyaux K de 
Frobenius, mais Thompson (1959) a 
démontré une conjecture de Frobenius : 
tous ces noyaux sont des groupes nilpo- 
tents. 

Une autre sous-famille est la famille des 
groupes de Zassenhaus. Un groupe de 
Zassenhaus G est un groupe transitif de 
permutations sur un ensemble E, tel que la 
restriction d’un stabilisateur G, soit un 
groupe de Frobenius sur l’ensemble formé 
de E moins l’élément x. Pour éviter les cas 
triviaux, on suppose aussi qu’il n’y a pas de 
sous-groupe régulier distingué dans G. 
Zassenhaus, Feit, Ito et Suzuki sont arrivés 
à une classification complète des groupes 
de Zassenhaus. Un tel groupe G est soit un 
PSF(2, K) pour un corps fini K (cf. infra , 
chap. 2), ou une extension de ce groupe par 
un groupe d’ordre 2, soit un des groupes de 
Suzuki (une autre famille de groupes 
simples découverte par Suzuki en 1960 lors 
de l’étude de ce problème). 

Un groupe G de permutations sur un 
ensemble E est n-fois transitif, pour un 
entier positif n, si E ^ n , et si, chaque fois 
que l’on considère deux n-chaînes X], ... . X n 
et y,, . . . . y n d’éléments de E où les Xj, . . . . 
x n (resp. v | , • • • • y n ) sont tous distincts, il 
existe au moins une permutation tt dans G, 
telle que ir(.Y,) = y,, . . . . n{x n ) = y n . Les 
groupes de Zassenhaus sont des groupes 

2 - fois transitifs . Le groupe symétrique 

est n-fois transitif, pour tout n ^ 1. Le 
groupe alterné A„ est (/? 2)-fois transitif 
pour n ^ 3. Il y a beaucoup de groupes 

3- fois transitifs, les groupes PGL(2, K), 
par exemple, où K est un corps fini. Mais 
on ne connaît que quatre groupes 4-fois 
transitifs, autres que les groupes pour n 


^ 4, et A, pour 6. Ce sont les groupes 
de Mathieu (1861 et 1873) M 24 , Mp, 
M n , dont les degrés et les ordres sont : 
deg (M 24 ) = 24, avec M 24 = 

244 823 040 ; deg (M 23 ) = 23. avec 
|M 23 |= 10200960; deg (M j2 ) = 12, 
avec | M 12 1 = 95040; deg (M„) = 11, 
avec Mp = 7 920. Les groupes M 24 et 
Mp sont même 5 -fois transitifs, mais non 
O-fois transitifs. On a de bonnes raisons de 
croire que tout groupe 6-fois transitif (ou 
plus) est Tj fl ou A,„ mais il n’y a aucune 
démonstration de cette conjecture. 


2. Groupes simples 

Si H est un sous-groupe distingué d’un 
groupe fini G, le morphisme surjectif 
naturel de G sur le groupe quotient G/H, 
ayant H pour noyau, nous donne une sorte 
d’analyse du groupe G en les deux groupes 

H et G/H. Les deux cas H = {1}, et H = 

G sont triviaux, le groupe G étant alors 
isomorphe à l’un des deux groupes H et 
G/H. Dans tous les autres cas, les ordres 
G/ H et H sont strictement plus petits 
que l’ordre de G. Les groupes G/H et H 
sont donc plus simples que G. Le groupe 
G est appelé simple si G # { 1} et si l’on 
ne peut pas l’analyser ainsi en des groupes 
d’ordre strictement plus petit, c’est-à-dire 
si { 1 } et G sont les seuls sous-groupes 
distingués de G. Par exemple, pour chaque 
entier premier p , le groupe cyclique C p 
d’ordre p est simple. 

Tout groupe fini G peut se décomposer 
en groupes simples :siG = {1}, il n’y a 
rien à faire ; si G ^ { 1 }, il y a toujours un 
sous-groupe distingué H, de G tel que 
G/H| soit un groupe simple. Si H, = {1}, 
l’analyse est terminée. Sinon, il existe un 
sous-groupe distingué H-> de H„ tel que 
H,/H 2 soit un groupe simple. Si on itère 
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cette construction, on aboutit à une suite 
G = H 0 , H„ H 2 , H„ = { 1 } de SOUS- 
groupes de G, où H,- est distingué dans 
H ■_ j , et où H,-, /H ; est un groupe simple, 

/ = 1, .... fl. Une telle suite s’appelle une 
suite de Jordan-Hôlder du groupe fini G, et 
les groupes quotients H 0 /H|, H,/H 2; .... 
H„_i/H n : s’appellent les facteurs de 
Jordan-Hôlder de G. La terminologie 
adoptée ici suit N. Bourbaki ; les théori- 
ciens des groupes finis, traditionnellement, 
continuent à réserver le terme de suite de 
composition à ce que nous appelons ici 
suite de Jordan-Holder. 

Considérons, par exemple, le groupe 
symétrique Z 4 des permutations de 1, 2, 3, 
4. L’ordre de X 4 est 4 ! =24. Le groupe 
alterné A, d’ordre 4 !/2 = 12 est un 
sous-groupe distingué dans Z 4 , et le groupe 
quotient £ 4 /A 4 est isomorphe au groupe 
simple C?. Les trois permutations (12)(34), 
(13)(24), (14)(23) forment avec l’identité 
un sous-groupe V d’ordre 4 dans A, qui 
s’appelle le 4-groupe de Klein . Ce groupe V 
est distingué dans Z 4 , et donc dans A,. Le 
groupe quotient A 4 /V est isomorphe au 
groupe C 3 . Le 4-groupe V est commutatif, 
et tous ses sous-groupes sont distingués. 
Pour o = (12)(34), ou a = (13)(24), ou 
a =; (14)(23), le sous-groupe {a, 1} est 
isomorphe à C 2 , ainsi que le groupe 
quotient V/ { a, 1 } . On a donc construit 
pour Z 4 une suite de Jordan-Holder Z 4 , A„ 
V, {a, 1 } , { 1 } , ayant comme facteurs de 
Jordan-Holder C 2 , C 3 , C 2 , C 2 (à des iso- 
morphismes près). 

Un groupe fini dont chaque facteur de 
Jordan-Holder est isomorphe à un C^, où 
p est un nombre premier, est dit résoluble . 
Le groupe Z 4 est donc résoluble. 

Dans l’exemple ci-dessus, il y avait trois 
choix possibles pour le groupe {(J, 1 }. Un 
groupe G peut donc avoir plusieurs suites 
de Jordan-Holder. Il y a malgré tout une 


certaine unicité des suites de Jordan- 
Hôlder ; les facteurs de Jordan-Hôlder de G 
sont indépendants du choix de la suite de 
Jordan-Hôlder (théorème de Jordan- 
HÔlder ), c’est-à-dire que, si G = H 0 , H], . . . . 
H„ = {1}, et G = K 0 , K[, . . . . K„, = { 1 } 
sont deux suites de Jordan-Holder de G, 
on a n = m, et il existe une permutation 
TT de { 1, ... . m = n) telle que le groupe 
H,-, /H, soit isomorphe au groupe J 
K^j), pour tout i = l, .... m = n. Chaque 
groupe fini peut donc être analysé en 
groupes simples uniques, qui sont ses 
facteurs de Jordan-Holder. D’où l’impor- 
tance de l’étude des groupes simples. 

Les premiers groupes simples non cycli- 
ques furent découverts dans la première 
moitié du XIX e siècle. Les groupes alternés 
A„ sont des groupes simples, pour tout 
p ^ 5. C’est sur cette découverte que 
repose la démonstration moderne du théo- 
rème suivant d’Abel (1824) : Les équations 
de degré 5 ne sont pas résolubles au moyen 
des seules opérations d’addition, de sous- 
traction, de multiplication, de division et 
d’extraction des racines n-ièmes effectuées 
sur leurs coefficients. 

Puis, en étudiant les groupes linéaires 
sur un corps fini K, on découvrit d’autres 
groupes simples. Pour chaque entier 
A ^ 1, les a X a matrices (a,) à coeffi- 
cient a,, dans K, et de déterminant det (a ( y) 
non nul, forment un groupe GL(tt,K) pour 
la multiplication (a /y ) (b,,) = (c,) où : 

C ij — ^ ' a ik bfcjJ 
k - 1 

avec i =j = 1, . . . . n. 

Le groupe GL(fl,K) s’appelle le groupe 
linéaire général de degré n sur K. L’appli- 
cation (a,) i— ► det(a,y) est un morphisme 
surjectif du groupe GL(fl,K) sur le groupe 
multiplicatif du corps K. Le noyau SL(fl, 
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K) de ce morphisme surjectif est donc un 
sous-groupe distingué de GL (n, K). Le 
centre Z de GL (n, K), formé des matrices 
de la forme xi, où / est la matrice identité 
et x un élément non nul de K, est aussi un 
sous-groupe distingué. Le groupe quotient 
GL(«, K)/Z se note par PGL(«, K), et 
l’image SL(«, K)Z/Z de SL(«, K) dans ce 
groupe par PSL (n, K). Jordan et Dickson 
ont montré que, si n ^ 3, ou si n = 2 et 
si K a plus de trois éléments, le groupe 
PSL(/l K) est simple ; c’est le seul facteur 
de Jordan-Hôlder de GL (n, K) qui soit 
simple et non cyclique. 

La théorie des groupes linéaires géné- 
raux a été étendue aux autres groupes 
classiques par Jordan, Dickson et d’autres, 
vers la fin du XIX e siècle. Pour chaque 
groupe linéaire général, orthogonal, sym- 
plectique ou unitaire, ils trouvèrent un ou 
plusieurs groupes correspondants (cela 
pour tout corps fini K). À quelques excep- 
tions près (elles sont en nombre fini), tous 
ces groupes ont la propriété du groupe 
GL(/î, K) ; ils ont un et un seul facteur de 
Jordan-Hôlder qui soit simple et non 
cyclique. 

Les groupes simples définis par les 
groupes classiques sont eux-mêmes des cas 
spéciaux des groupes simples de Lie. En 
plus de ces groupes, il y a cinq groupes de 
Lie simples exceptionnels. Dickson décou- 
vrit des groupes finis correspondant à 
certains de ces groupes exceptionnels, mais 
c’est Chevalley. en 1955, qui donna une 
méthode générale de construction des 
groupes finis simples, correspondant à 
n’importe quel groupe simple de Lie (cf. la 
partie E ci-après Groupes de Lie). Il 
découvrit ainsi de nouveaux groupes finis 
simples, correspondant aux autres groupes 
de Lie exceptionnels. Steinberg (1959) 
compléta le travail de Chevalley en cons- 
truisant des variantes de ces groupes. Pour 


cela, il s’est inspiré de la construction des 
groupes unitaires comme des variantes des 
groupes linéaires généraux. 

En 1959, la liste des groupes finis 
simples qui étaient connus contenait les 
groupes alternés A,„ les groupes de Che- 
valley, leurs variantes de Steinberg et cinq 
groupes isolés : les quatre groupes M, h 
M j2 , M 2 3, M 24 de Mathieu et le stabilisa- 
teur d’un élément de M 93 , qui s’appelle le 
groupe de Mathieu . Les groupes de 
Mathieu mis à part, tous ces groupes 
appartenaient à de bonnes familles infinies. 

Cet ordre relatif fut ébranlé par Suzuki, 
qui découvrit, en étudiant les groupes de 
Zassenhaus, une nouvelle famille infinie de 
groupes simples de permutations. Mais 
Rhee s’aperçut bientôt, en 1961, que l’on 
pouvait construire ces groupes de Suzuki 
avec une nouvelle variante de la construc- 
tion de Chevalley, variante possible seule- 
ment pour certains corps finis. En appli- 
quant cette méthode à d’autres groupes 
simples de Lie, Rhee trouva deux nouvelles 
familles infinies de groupes finis simples. 
Les groupes de Suzuki et de Rhee n’étant 
que des variantes des groupes de Cheval- 
ley, tout rentra dans l’ordre. 

L’ordre ne dura pas longtemps. En 
classant les groupes finis simples possédant 
des 2-sous-groupes de Sylow abéliens, 
Janko (1966) découvrit un nouveau 
groupe simple isolé d’ordre 175 560. 
Depuis lors, de nombreux autres groupes 
finis simples, apparaissant comme isolés et 
exceptionnels (d’où leur nom de « groupes 
sporadiques ») ont été découverts : le 
nombre de ces groupes sporadiques, 
incluant les groupes de Mathieu, était de 
vingt-six en 1980. 

Il est nécessaire ici de préciser ce que 
l’on entend par « découverte » d’un 
groupe fini simple sporadique. En effet, 
l’existence de nombre de ces groupes a 
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souvent été prédite avant d’être effective- 
ment prouvée, la prédiction se fondant sur 
des coïncidences numériques ou structu- 
relles que le hasard seul ne pouvait raison- 
nablement expliquer. On peut noter l’ana- 
logie de cette démarche scientifique avec 
certains aspects de l’histoire de la théorie 
des particules élémentaires. C’est ainsi que 
Janko a prédit en 1974 l’existence du 
quatrième des groupes sporadiques qui 
porte son nom, mais qu’il a fallu attendre 
1 980 pour qu’une construction effective de 
ce groupe soit menée à bien à l’université 
de Cambridge, à l’aide de nombreuses 
heures de calcul sur ordinateur. 

Le plus « gros » des groupes sporadi- 
ques est celui que l’on a dénommé le 
« monstre », dont l’existence a été prédite 
en 1973 par B. Fischer et R. Griess ; son 
nombre d’éléments est de l’ordre de 10 54 . 
Malgré l’énormité de ce nombre, il semble 
pourtant que l’existence des groupes spo- 
radiques traduise le phénomène souvent 
rencontré que certaines propriétés des 
nombres entiers ne sont vraies qu’à partir 
d’une certaine valeur : les petits nombres 
sont souvent exceptionnels. De fait, le plus 
grand nombre premier divisant le nombre 
d’éléments d’un groupe sporadique est 71 
(en l’occurrence, 71 divise l’ordre du 
monstre). L’existence des groupes spora- 
diques semble également liée aux coïnci- 
dences ou isomorphismes exceptionnels 
entre « petits » groupes classiques. 

Les spécialistes ont annoncé en 1980 
que la classification des groupes finis 
simples était achevée, et par conséquent 
que les seuls groupes finis simples sont les 
groupes cycliques d’ordre premier, les 
groupes alternés de degré supérieur à 5, les 
groupes classiques et leurs variantes cons- 
truits par Chevalley et ses successeurs 
(groupes appelés désormais « groupes de 
type de Lie »), et enfin les vingt-six groupes 


sporadiques connus. Le nombre de pages 
imprimées consacrées au travail de classi- 
fication des groupes finis simples est de 
l’ordre de 10 000 ; les démonstrations 
s’appuient très souvent les unes sur les 
autres, et sont en général très complexes. 
Aucun mathématicien n’est en mesure, 
aujourd’hui, de vérifier tout seul cette 
gigantesque démonstration ou d’en com- 
prendre les mécanismes profonds, et cer- 
tains spécialistes pensent donc que, dans 
son état actuel, elle n’est pas tout à fait 
convaincante. Il est à noter que cette 
démonstration ne fournit aucune preuve a 
priori de l’existence d’un nombre fini de 
groupes sporadiques. Ce n’est qu’a poste- 
riori, une fois la classification établie, que 
l’on constate que tel est bien le cas. 

Le principe de la démonstration est 
celui de la récurrence : considérant un 
groupe G dont tous les facteurs de Jordan- 
Hôlder de tous les sous-groupes propres 
sont isomorphes à l’un des groupes 
« connus », on essaye de démontrer que G 
est lui-même isomorphe à un groupe 
connu. L’outil essentiel de cette démarche 
est l’étude des centralisateurs dévolu- 
tions, qui repose sur deux résultats fonda- 
mentaux. Le premier est dû à R. Brauer, 
et affirme qu’il n’y a qu’un nombre fini de 
groupes finis possédant une involution 
(c’est-à-dire un élément de carré l’identité) 
dont le centralisateur (c’est-à-dire l’ensem- 
ble des éléments du groupe qui commutent 
avec cette involution) soit isomorphe à un 
groupe fixé. 

Le deuxième, dont la démonstration est 
l’une des plus difficiles de l’histoire des 
mathématiques, est dû à W. Feit et 
J. G. Thompson (1963) ; il affirme que tous 
les groupes finis et simples sont d'ordre pair , 
à l'exception des groupes cycliques C p 
d'ordre premier p. Ce remarquable théo- 
rème a été une conjecture « impossible » 
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pendant plus de cinquante ans. Il est à la 
base de plusieurs travaux qui cherchent à 
classer certaines sous-familles de groupes 
simples distingués par les propriétés de 
leurs sous-groupes. Par exemple, les grou- 
pes finis simples dont les 2-sou s-groupes de 
Sylow sont dièdres furent classés par 
Gorenstein et Walter (1965). De tous les 
théorèmes de classification, le plus impor- 
tant et le plus difficile est le théorème de 
Thompson (1966) pour les groupes sim- 
ples minimaux , c’est-à-dire pour les grou- 
pes finis simples G tels que chaque sous- 
groupe H =£ G soit résoluble. Cette 
classification a déjà permis de démontrer 
plusieurs conjectures anciennes, ainsi que 
de nouveaux théorèmes. 

L’un des aspects les plus mystérieux de 
la théorie des groupes finis est le phéno- 
mène baptisé moonshine par 
J. H. Conway. Il s’agit d’une correspon- 
dance extraordinaire entre le monstre et la 
théorie des fonctions automorphes, cor- 
respondance constatée mais à ce jour 
totalement inexpliquée. Il existe une série 
formelle : 

j < x >=^+5>- x "’ 

n > 1 

à coefficients dans l’anneau des caractères 
du monstre, possédant la propriété sui- 
vante : pour tout élément g du monstre, la 
fonction j(g) définie sur le demi-plan de 
Poincaré J6 — {z E C/Im z > 0} par : 

jig){z) - ^ ^ C n (g)q a , o uq = e 2 ** 

n ÿ 1 

est une fonction remarquable ; plus préci- 
sément, il existe un sous-groupe discret 
T(g) de GL 2 (Q) tel que la surface 3t/T(g) 
se compactifie en une surface de genre 0, 
et toutes les fonctions modulaires pour 
V(g) s’expriment rationnellement en j(g). 


La fonction y(l) est, à une constante près, 
l’invariant modulaire j. 


3. p-groupes 

Si H est un sous-groupe d’un groupe fini G, 
son ordre | H |, son indice [G : H] (c’est- 
à-dire le nombre de classes à gauche de H 
dans G) et l’ordre | G | de G sont liés par 
le théorème de Lagrange (1770) : 

(2) I G | = [G : H] | H | . 

En particulier, | H | divise | G |. Soit p un 
nombre premier et p n la plus grande 
puissance de p qui divise | G |. Tout p-sous- 
groupe H de G (c’est-à-dire tout sous- 
groupe dont l’ordre | H | est une puissance 
p k de p) a un ordre | H | < p n . Si | H | = p", 
on dit que H est un p-sous-groupe de Sylow 
de G. Il y a plusieurs théorèmes de Sylow 
(1872) pour ces sous-groupes : 

1. Tout groupe fini G a au moins un 
p-sous-groupe de Sylow P. 

2. Tout autre p-sous-groupe de Sylow Q 
de G est un conjugué de P, c’est-à-dire que 
Q = oPcr -1 , pour un élément a de G. 

3. Tout p-sous-groupe H de G est un 
conjugué d’un sous-groupe de P, c’est-à- 
dire que tHt^ 1 C P, pour un élément r de 
G. 

4. Le nombre / des p-sous-groupes de 
Sylow de P divise [ G | et est de la forme 
/ = 1 + pm, pour un certain entier m. 

Le deuxième de ces théorèmes implique 
que le p-sous-groupe de Sylow P est 
déterminé, à un isomorphisme près, par le 
groupe G. On peut donc classer les grou- 
pes finis suivant leurs p-sous-groupes de 
Sylow ; d’où l’importance de la théorie des 
p-groupes (groupes P dont l’ordre est une 
puissance p k > 1 d’un nombre premier p). 
L’une des propriétés de ces groupes est 
que leurs centres Z(P) sont toujours non 
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triviaux, soit Z(P) { 1 } . Chaque p-groupe 
P est donc nilpotent (cf. la partie A 
ci-dessus - Généralités, fin du chap. 3). 

Si G est un groupe fini et si E est un 
sous-ensemble de G, le normalisateur 
No(E) de E dans G est le sous-groupe 
formé des éléments (7 de G, tels que 
(Æo -1 = E. On montre alors qu’un 
groupe fini G est nilpotent si et seulement 
si tout sous-groupe H de G, différent de G, 
est strictement contenu dans son norma- 
lisateur No(H). On peut aussi montrer 
qu’un groupe fini G est nilpotent si et 
seulement si G n’a qu’un p-sous-groupe de 
Sylow pour chaque nombre premier p. 
Dans ce cas, G est le produit direct de ses 
uniques sous-groupes de Sylow G /r Les 
groupes finis nilpotents sont donc « pres- 
que » des p-groupes. 

Plusieurs théorèmes relient la structure 
des normalisateurs No(H) des p- SOUS- 
groupes H ^ { 1 } d’un groupe fini G avec 
celle de G. Frobenius a, par exemple, donné 
un critère pour la p-n il potence de G , c’est- 
a-dire pour l’existence d’un sous-groupe 
distingué K dans G tel que P H K = { 1 } et 
PK = G pour tout psous-groupe de Sylow 
P. Voici le critère : un groupe fini G est 
p-nilpotent si le normalisateur No(H) est 
p-nilpotentpour tou tp-sou s-groupe H # {1 } 
de G. Notons qu’en général ces norma- 
lisateurs No(H) sont plus petits que G 
(par exemple, si G est simple et non cycli- 
que). 

Certains travaux récents de Thompson 
ont montré qu’il n’est pas nécessaire de 
vérifier lap-nilpotence de N, (H) pour tout 
p-sous-groupe H de G. Il suffit d’en choisir 
quelques-uns qui soient significatifs. Le 
plus important de ses résultats est le sui- 
vant : Soit P ^ { 1 } un p-sous-groupe de 
Sylow de G, et soit s le maximum des ordres 
S des sous-groupes commutatifs S de P. 
L’intersection A des sous-groupes commu- 


tatifs S de P, ayant pour ordre S = s, est 
un sous-groupe non trivial et distingué de 
P. Thompson a montré que le groupe G est 
p-nilpotent si No(A) l’est et sip ^ 3. Il suffit 
donc de regarder le normalisateur du seul 
p-sous-groupe A de G. 

Il y a d’autres généralisations du théo- 
rème de Frobenius à des théorèmes sur 
l’existence de p-groupes quotients du 
groupe G sous certaines conditions sur les 
normalisateurs des p-sous-groupes de G. 
Les résultats de ce type jouent un rôle 
important dans l’étude des groupes sim- 
ples et, en particulier, dans le théorème de 
Feit et Thompson. 

EVERETT DADE 
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D. Représentation linéaire des 
groupes 

Développée d’abord comme moyen de 
classification des différentes apparences du 
même groupe G comme groupe de trans- 
formations linéaires, la théorie des repré- 
sentations linéaires est devenue un des 
outils les plus puissants pour l’étude de la 
structure de G. En particulier, les carac- 
tères irréductibles d’un groupe fini G, 
introduits pour mieux classer les représen- 
tations linéaires, sont vitaux pour la théorie 
moderne des groupes simples. 
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1. Représentation des groupes 

À chaque système mathématique S est 
associé son groupe de symétries (ou 
d ‘automorphismes) X(S). On considère ces 
groupes L(S) comme étant concrets. Une 
représentation R d’un groupe quelcon- 
que G comme groupe de symétries de S est 
un homomorphisme a l_ ^ R g de G dans le 
groupe concret C(S). Elle donne une réa- 
lisation de la loi de composition abstraite 
de G comme loi de composition concrète 
dans C(S). 

La théorie des représentations cherche 
les conséquences, pour les deux structu- 
res S et G, de l’existence d’une représen- 
tation R, et les utilise pour démontrer des 
théorèmes qui n’ont quelquefois rien à voir 
avec les représentations ; par exemple, le 
théorème de Feit et Thompson : tout 
groupe d’ordre impair est résoluble. Seules 
les relations entre S et G étant intéressan- 
tes, la tendance moderne est de les définir 
directement et de supprimer le groupe 
C(S) et l’ homomorphisme R. Voici, sur un 
exemple, comment on procède. 

Une opération d’un groupe G sur un 
ensemble E est une loi de composition 
externe, envoyant tout élément o de G et 
tout élément x de E sur un élément GX de 
E, et suppose que cette loi satisfait aux 
conditions : 

(la) \X = X 

pour tout x dans E, 

(1 b) (<rf)x = a (tx ), 

pour tout a, T dans G et tout x dans E, où 
GT est le produit dans G, et 1 l’élément 
neutre de G. Ces conditions impliquent 
que, pour tout g de G, l’application : 
.V l ~* GX est bijective de E sur E, c’est-a-dire 
que R g est une permutation sur l'ensem- 
ble E. Et l’application G •— * R g est un 


homomorphisme de G dans le groupe 
C(E) des permutations sur E (que l’on peut 
considérer comme les symétries de E). 
L’opération de G sur E détermine donc 
une représentation R de G comme groupe 
de symétries de E. En fait, la représenta 
tion et l’opération ne sont que deux façons 
de voir la même chose, car la première 
détermine la seconde par la relation 
GX = R a (x), pour tout 0 de G et tout X 
de E. 

Une représentation linéaire d’un 
groupe G est une représentation de G 
comme groupe de symétries d’un espace 
vectoriel. Rappelons qu’un espace vecto- 
riel V sur un corps K est un groupe additif 
muni d’une loi de composition externe, qui 
envoie tout élément À de K et tout élément 
V de V sur un élément Av de V, et qui est 
telle que les combinaisons linéaires 

ÀjVi + + d’éléments vq, v„ de V 

à coefficients Àj, . . . . A, dans K obéissent 
aux règles ordinaires de calcul. Une opé- 
ration linéaire de G sur V est une opération 
de G sur l’ensemble V, satisfaisant à la 
condition de linéarité : 

<^(A i v | + + À.„v„) 

= Aj <7(V!) + + A„a(v„) 

pour tout g de G, tout A„ . . . . \ n de K, et 
tout iq, . . . . v n de V. Chaque application R a : 
v - gv est alors une transformation 
Maire bijective de V sur lui-même, et 
l’ homomorphisme g * R’, est une repré- 
sentation linéaire de G sur V. On dit alors 
que V est un G-espace. 

On dit que deux représentations 
g ^ R 0 et o ^ R a , sur des espaces 
vectoriels V et V' sont équivalentes 
(ou isomorphes) s’il existe un isomor- 
phisme linéaire de V sur V’ tel que 
R a = cp _I n R’, n cp pour tout G E G, ce qui 
équivaut à cp 0 R CT = R’, o <P* 
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Il y a une autre façon, souvent utile, de 
considérer les représentations linéaires. 
Supposons que l’espace vectoriel V ait une 
base finie V], . . . . V rf , c’est-à-dire que tout 
élément y de V ait une expression unique : 
y = À j V i + iii + \ { v (h comme combinai- 
son linéaire des éléments Vj, . . . . v c j de la 
base, à coefficients Àj, . . . .A, dans K. Pour 
tout élément (j de G, il existe alors 
des éléments uniques a,y((j) dans K tels 
que : 

d 

ovj = ^ ûÿ(a)v y , pour j- 1, — d. 

/=i 

La d X cl matrice, A(o) = (a„(o)), 
détermine la transformation linéaire R a 
par les équations ci-dessus. Les condi- 
tions (1) équivalent à dire que l’applica- 
tion A : a Mo) est un homomorphisme 
du groupe G dans le groupe GL (d, K) de 
toutes les matrices d X d dont le détermi- 
nant n’est pas nul. 

On peut donc regarder les représenta- 
tions linéaires ou les opérations linéaires 
comme des homomorphismes dans GL(</, 
K). 

Cette façon de voir facilite la définition 
du caractère du G-espace V. C’est la 
fonction de G dans K dont la valeur 
X V ((J) est la trace, Tr(A(o)), de la 
matrice A (a) : 

Xv(o) = Tr (A (a)) 

= a„(o) + a^cr) + ... + a M (a), 

pour tout a de G. 

La trace de A(o) est indépendante du 
choix de la base Vj, . . . . \\j et ne dépend que 
de la transformation linéaire Ro. Le carac- 
tère est donc déterminé par l’opération. 
Dans certains cas importants, la récipro- 
que est vraie, c’est-à-dire que l’opération 
de G sur V est déterminée par le caractère 
Xv (cf- infra). 


11 faut noter la propriété suivante du 
caractère qui découle de l’équation 

Tr (AB) — Tr (B A) pour des matrices A et 
B : 

(2) Xv(t _1 ot) = XvW, 

pour tout a, T dans G. 

On dit que deux éléments, a et p de G 
sont conjugués s’il existe un élément T de 
G tel que p = Les classes d’équi- 

valence pour cette relation de conjugaison 
s’appellent les classes de conjugaison de G. 
La condition (2) signifie donc que chaque 
caractère est constant sur chaque classe 
de conjugaison de G. 

2. Théorie des représentations 
linéaires d'un groupe fini 

La théorie classique trouvée par G. FfO- 
benius, W. Burnside, et I. Schur dans la 
période 1890-1 9 10 est la base de toutes les 
généralisations modernes. Cette théorie 
s’applique aux représentations linéaires 
d’un groupe fini G sur des espaces vecto- 
riels de dimensions finies (c’est-à-dire 
ayant une base finie) sur le corps C des 
nombres complexes. 

On cherche, d’abord, à classer les 
G-espaces, à des isomorphismes près. Un 
G-espace V est G-isomorphe à un 
G-espace U s’il existe une application 
linéaire bijectivefde V sur U qui conserve 
les opérations de G :f(ov) — a/(v), pour 
tout (J dans G, et tout V dans Y, c’est-à-dire 
si les représentations linéaires sont équi- 
valentes. 

L’outil principal de la classification des 
opérations linéaires de G sur des espaces 
vectoriels V est la décomposition des 
espaces Y en somme directe de sous- 
espaces stables. Un sous -espace de Y est un 
sous-ensemble U, qui est fermé pour la 
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formation de combinaisons linéaires d’élé- 
ments ; U est donc lui-même un espace 
vectoriel avec, pour lois de composition, 
les restrictions des lois de composition de 
V. Le sous-espace U est stable par G s’il est 
fermé pour l’opération de G sur U, c’est- 
à-dire si ou appartient à U pour tout <J dans 
G et tout u dans U. Dans ce cas, la 
restriction à U de l’opération de G sur V 
est une opération linéaire de G sur U. Soit 
U,, . . . . U* des sous-espaces stables de Y. 
On dit que V est la somme directe 
U t © © U* des U,-, si tout élément v 

de V a une expression unique de la 
forme : 

v = u x + u 2 + ... + u k , 

où Uj appartient à U,* pour i = 1, . . . . k. 

Les éléments u j, . . . . sont les compo- 
santes de v pour la décomposition V = 
Uj © © U*. La correspondance : 

v — (a 

est une bijection de Y sur le produit 
cartésien Uj X . . X U* ; les lois de com- 
position de V et l’opération de G sur V se 
calculent à partir des structures des U,- par 
les relations : 

v + Y’ = (w i + u i ) + ». + (u k + u k )> 

\ = (Xm,) + + (ku k ), 
ov = (ou i) + + (tfN*), 

où À appartient au corps, Q au groupe, et 
où v’ est un élément de V ayant comme 
composante les éléments . . . . U }.. La 
décomposition V = U, 0 © U* donne 
donc une analyse de la structure de Y au 
moyen de celles des U,-. 

Si G opère sur un espace vectoriel 
U {0}, et s’il n’y a aucun sous-espace 
stable par G, sauf U et {0}, on dit que le 
G-espace U est irréductible. La classifica- 
tion des opérations linéaires d’un groupe 
fini G sur des espaces vectoriels V de 


dimension finie sur le corps C des nombres 
complexes est contenue dans les deux 
énoncés suivants : 

(3fl) l’espace V a au moins une décompo- 
sition : V = Uj© © U*., en somme 
directe de sous-espaces stables et irréduc- 
tibles \J { , .... ; 

(3b) si Y = 17 [ © © U’, est une autre 
telle décomposition, alors l = k et, après 
une permutation convenable des indices, 
U, est G-isomorphe à U'/, pour i = l, ... . 
k. 

Pour tout G-espace irréductible W, on 
définit la multiplicité, m ( W dans V), de W 
dans V. C’est le nombre des indices 

i — 1, l pour lesquels W est 

G-isomorphe à U,. À cause de (3 b), cette 
multiplicité est indépendante de lù décom- 
position V = Uj © © U*. Donc deux 
G-espaces V et V’ sont isomorphes si, et 
seulement si : 

m (W dans V) = m (W dans V'), 

pour tout G-espace irréductible W. 

Frobenius découvrit une méthode très 
simple de calcul des multiplicités m( W 
dans Y) en utilisant les caractères. On 
définit un produit hermitien (/] g) G sur 
l’espace vectoriel Fct(G, C) de toutes les 
fonctions de G dans C par : 

( ^ | ? ) G = |^l £ /(»)£(& 

uGG 

pour tout / et g dans Fct(G, C), ou g(o) 
désigne le complexe conjugué de g(o) et 
| G | est l’ordre de G, c’est-à-dire le nombre 
d’éléments dans le groupe fini G. Si W et 
U sont deux G-espaces irréductibles de 
dimension finie sur G, Frobenius a démon- 
tré les relations d’orthogonalité suivantes, 
pour leurs caractères ^ et x, u : 

(4 à) (Xw | Xu)g = 1 » 
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si W est G-isomorphe à U ; 

(4 6) (Xw Xu)g=0> 

si W n’est pas G-isomorphe à U. 

La décomposition, V = U| © © U*, 
entraîne pour les caractères la relation : 

xv = Xu, + - + Xu** 

On a donc, d’après les relations d’ortho- 
gonalité (4), la formule suivante pour la 
multiplicité de W dans V : 

m (W dans V) = (/ w Xv)o 

On voit que le caractère Xv détermine 
les multiplicités m( W dans V). Le G-espace 
V est donc déterminé à un isomorphisme 
près par son caractère Xv- 

Les relations d’orthogonalité (4) mon- 
trent que les caractères irréductibles (les 
caractères des G-espaces irréductibles) dis- 
tincts sont des fonctions linéairement indé- 
pendantes sur le groupe fini G. Il n’y a 
donc qu’un nombre fini Xp . . . . x^ de tels 
caractères. On peut alors montrer que le 
nombre c des caractères irréductibles de G 
est égal au nombre des classes de conju- 
gaison de G. 

Soit H un sous-groupe de G. Tout 
G-espace Y est, par restriction, un 
H-espace V H . Le caractère de cet H-espace 
est la restriction Xh du caractère x du 
G-espace V au sous-groupe H. Donc la 
restriction x l— * Xh est une application 
des caractères de G dans ceux de H. 
Frobenius découvrit une application, 
allant en sens inverse, envoyant tout 
caractère <p de H sur le caractère induit cp G 
de G défini par : 

(5) cp°(a) = 1 ^ ^ 

t£G 

t 1 <tt<E G 

pour tout o de G, où la sommation sur 
l’ensemble vide est nulle par définition. 


Frobenius a démontré la lui de récipro- 
cité : 

(6) (XhI<P)h= (X|<P°)g. 

pour tout caractère x de G et tout carac- 
tère (p de H. 

On peut calculer les caractères irréduc- 
tibles de G en utilisant les caractères 
induits : on part de certains sous-groupes 
H de G, et de certains caractères connus 
cp de H. À l’aide de (5), on calcule les 
caractères induits cp G , qui sont, comme 
tous les caractères, des combinaisons 
linéaires a jXi ~h + ClJLc à coefficients 
entiers a,, . . . . a c des caractères irréducti- 
bles x h • • • • TU de G- On cherche alors un 
nombre suffisant de caractères cp G , de telle 
manière qu’ils engendrent le groupe additif 
X(G) de toutes ces combinaisons linéaires 
de Xb • • • • Xr H faut donc trouver les 
éléments : 

X = «iXi + -+ û cXc 
de X(G) tels que : 

(X X)g = a] + + a] = i. 

Un tel élément est forcément de la 
forme ± Xh °ù i = h - • • • C. Comme 
X,( 1) > 0, on peut déterminer le caractère 

Xr 

Cette méthode est justifiée, car 
R. Brauer a montré que X(G) est en fait 
engendré par les caractères induits cp G , où 
(p parcourt la famille de tous les caractères 
linéaires (c’est-a-dire irréductibles de 
degré 1) des sous-groupes H de G. On 
peut même se restreindre aux sous-grou- 
pes H qui sont nilpotents. Un caractère 
linéaire cp d’un sous-groupe H est simple- 
ment un homomorphisme o i— ► cp(a) de H 
dans le groupe multiplicatif du corps C. 
Ces caractères sont donc faciles à cal- 
culer. 
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3 . Les généralisations 

La théorie classique, exposée ci-dessus, a 
été au fil des années généralisée de plu- 
sieurs façons. L’une d’elles consiste à 
remplacer le corps C des nombres com- 
plexes par un autre corps K. Si le corps K 
est de caractéristique zéro, ou p (l’entier p 
étant un nombre premier qui ne divise pas 
l’ordre fini | G de G), la théorie des 
représentations linéaires de G sur les 
espaces vectoriels de dimension finie sur K 
se réduit facilement à la théorie classique 
des caractères complexes de G, et l’on 
n’obtient aucune notion nouvelle. Par 
contre, si la caractéristique p de K est un 
nombre premier qui divise l’ordre G |, on 
trouve une nouvelle famille de représenta- 
tions irréductibles et de caractères de G, 
les caractères modulaires. L’étude de ces 
caractères modulaires et de leurs relations 
avec les caractères complexes, due surtout 
à R. Brauer, a permis de trouver, pour ces 
derniers, des lois et identités nouvelles. 
Plusieurs théorèmes importants sur les 
groupes simples n’ont pu être démon- 
trés que grâce à la théorie de ces caractè- 
res. 

Une autre famille de généralisations de 
la théorie classique concerne les représen- 
tations unitaires continues d’un groupe 
topologique sur un espace de Hilbert. Un 
groupe topologique G est un groupe muni 
d’une topologie par rapport à laquelle la 
multiplication et l’inversion sont des appli- 
cations continues. Un espace hilbertien V 
est un espace vectoriel sur les nombres 
complexes C muni d’un produit hermitien 
(u | v) (c’est-à-dire une application de 
Y X Y dans C telle que l’application 
U ( u v) est linéaire pour tout V dans V, 

(u v) = (v u) pour tout u et v dans V, et 
(u | u) est un nombre réel strictement 
positif pour tout u ^ 0 dans V) et complet 


pour la norme | v | = (v v) l/2 définie par 
ce produit hermitien. Une opération 
linéaire de G sur V est continue si l’appli- 
cation (a, u , v) — ► (av| u) est continue en 
tant qu’ application de G X V X Y dans 
C. Elle est unitaire si elle conserve le 
produit hermitien (av ov) = (u v) pour 
tout a dans G et tout u, v dans V. On dit, 
dans ce cas, que V est un G-espace de 
Hilbert. 

Lorsque le groupe topologique G est 
compact , la théorie est très semblable à la 
théorie classique. L’espace V admet alors 
une décomposition en somme orthogo- 
nale : 

N0U 

U€F 

d’une famille F de sous-espaces stables et 
irréductibles U. C’est-à-dire que les U sont 
des sous-espaces fermés de V, deux à deux 
orthogonaux pour le produit hermitien 
( u v), et tout élément v de Y admet une 
décomposition unique : 



en une somme convergente en norme de 
ses composantes \\j appartenant à U. 
Toute autre telle décomposition : 

v= © w 

W6E 

est équivalente à la première, en ce sens 
qu’il existe une application bijectivefde E 
sur F et, pour tout W de E, une application 
linéaire bijectiveg de W sur U =/(W) qui 
conserve les opérations de G et les pro- 
duits hermitiens sur les deux sous-espaces 
W et U. Donc Y est déterminé à un 
isomorphisme près par les multiplicités des 
G-espaces de Hilbert irréductibles W dans 
V, c’est-à-dire le nombre de sous-espaces U 
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appartenant à F, tels que U soit 
G-isomorphe à W. 

On peut montrer que toute représenta- 
tion unitaire continue irréductible d’un 
groupe compact est de dimension finie. Un 
groupe compact G possède donc des 
caractères irréductibles. Ces caractères 
satisfont aussi aux relations d’orthogona- 
lité (4), où le produit hermitien (x (p) G est 
défini par : 

(xl<Wo = x(o) 4>(o) c? ct. 

l’intégrale étant prise par rapport à la 
mesure de Haar normalisée (cf. intégra- 
tion ET MESURE r Chap. 3 ) l 

L 1 '- 1 

Lorsque le groupe G n’est pas compact, 
la théorie est beaucoup moins nette. Au 
lieu de décomposer V en sommes ortho- 
gonales, il faut le décomposer en intégrales 
orthogonales de G-espaces irréductibles. 
De telles décompositions, quand elles 
existent, ne sont pas nécessairement uni- 
ques. Les représentations irréductibles 
peuvent être de dimension infinie, et 
donc ne pas avoir de caractères. En 
général, tout devient très compliqué. Il y a 
néanmoins une théorie assez bonne pour 
les représentations des groupes classiques 
qui sont importants en mécanique quan- 
tique. 

4. Applications aux groupes finis 

Les caractères irréductibles Xb X< d’un 
groupe fini G forment un outil très puis- 
sant dans l’étude de G. On considère leurs 
valeurs comme des invariants numériques 
de G, invariants qui doivent satisfaire à 
plusieurs conditions fortes, comme les 
relations d’orthogonalité, et qui sont liés à 


la structure algébrique de G. On combine 
ces conditions et ces relations pour mon- 
trer des théorèmes parfois surprenants 
sur G. 

On utilise d’abord les caractères pour 
trouver des sous-groupes distingués de G. 
Pour / = 1, c, soit W, un G-espace 
ayant x, P our caractère ; on appelle noyau 
de Xp I e sous-groupe distingué Ker(X/) 
formé de tous les g de G opérant trivia- 
lement sur W, par QU’ = w, pour tout w 
dans W,. Il est important de noter que ce 
sous-groupe distingué est caractérisé par 
les valeurs de x, : c’est l’ensemble de tous 
les éléments 0 de G tels que X/( a ) = X/( 0- 

Il n’y a qu’un seul caractère Xi tel que 
Ker(x,) = G, le caractère trivial X\ dont les 
valeurs sont Xl(^) = 1 P our tout cj de G. 
Pour tout caractère non trivial Xh i ^ 2, il 
existe un élément a de G tel que X/f^) 

D- 

On peut aussi montrer que, pour tout 
élément a ^ 1 de G, il existe au moins un 
caractère non trivial Xi tel que Xi(®) 

Une connaissance très grossière des 
valeurs des caractères de G peut permettre 
de prouver l’existence d’un sous-groupe 
distingué K qui soit non trivial (K 7^ { 1 } , 
K 7^ G). Il suffit de trouver un seul élé- 
ment g 7^ 1 et un seul caractère non trivial 
Xj tel que X/0) = X/( a )- L e sous-groupe 
K = Ker(X/) est alors un sous-groupe 
distingué non trivial. 

On s’intéresse aux relations entre la 
structure des sous-groupes de G et les 
caractères de G. Une de ces relations a 
trait aux ensembles à intersections trivia- 
les. Un tel ensemble S est un sous-ensemble 
d’un sous-groupe H, appelé normalisa- 
teur de S, dont les conjugués o^Scr satis- 
font à : 

(la) S = a -1 Sa, 
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si a appartient à H ; 

(7 b) sn(a- 1 S(i) = 0 

si a est dans Ci mais non dans H. 

Voici un exemple d’un tel ensemble S : 
pour tout G de G, on désigne par Rac(a) 
l’ensemble de tous les T de G qui sont 
racines de Cl (il existe n tel que T n = a). 
Rac(a) est un ensemble à intersections 
triviales, et le sous-groupe H est le norma- 
lisateur du sous-groupe cyclique < G > 
engendré par a. C’est le groupe formé de 
tous les éléments p de G, tels que 
p -1 <a>p=<a>. 

Soit cpj, . . . . cp { les caractères irréducti- 
bles de H. On désigne par X(H S) le 
groupe additif formé des combinaisons 
linéaires : 

V “ <G9i + + 0 C <P c 

(à coefficients entiers a ,*) qui s’annulent 
hors de S. La fonction induite définie 
par (5), appartient alors au groupe X(G) 
formé des combinaisons linéaires à coef- 
ficients entiers des ^ . . . . ^ Les condi- 
tions (7) et la formule (5) entraînent : 

(8) vp°(ct) = ip(<7), 

pour tout o dans S et tout ip dans X(H S). 

En combinant cette équation avec la loi 
de réciprocité (6), on trouve que T appli- 
cation vp 1 — ► ip G est une isométrie 
X(H S) i — *■ X(G), c’est-à-dire que l’on a : 

(9) (q> G \V G ) G =Wv)R> 

pour tout cp et ip dans X(H| S). 

Frobenius fut le premier à utiliser 
cette isométrie. Il considéra le cas où S 
est égal au sous-groupe H moins l’élé- 
ment neutre 1. On désigne par K le 
sous-ensemble de tous les éléments r de G 
qui n’appartiennent à aucun conjugué 
G ‘Sa de S. Le théorème de Frobenius 


dit que l’ensemble K est un sous- 
groupe distingué de G. On appelle groupe 
de Frobenius tout groupe G possédant 
un sous-groupe H différent de { 1 } et 
de G, ayant la propriété énoncée dans le 
théorème de Frobenius. Le sous-groupe 
distingué K s’appelle le noyau de Fro- 
benius (cf. la partie C ci-dessus Groupes 
finis). 

La théorie des caractères exceptionnels 
est basée sur l’isométrie (9). Supposons 
que cp y et (p ; soient deux caractères irré- 
ductibles distincts de H tels que cp; cp ; 
appartienne à X(H S). On a alors : 

(<P, «lXl + ••• + a cXc 

pour certains entiers a „ a c . L’isométrie 

(9) et les relations d’orthogonalité (4) 
donnent : 

2 = (<P, — <Pj | qPi — <P;)h 

= ((<P/ — tp,) G |(cp, — =a\ + ... +a). 

Mais les a i sont des entiers. Ils sont donc 
tous nuis, sauf deux d’entre eux, a, et a p qui 
valent ± 1. Si a t = üj = ± 1, on a : 

0= (<p,- <p,)°(l)= ±(Xi(l)+ X;(l)). 

ce qui est impossible, car les degrés %•( 1) 
et XjO) sont des entiers strictement posi- 
tifs. On a donc : 

(9/ — C P;) G = ± (Xi Xj)' 

On dit que et sont Ls caractères 
exceptionnels de G correspondant à cp^ et 
cp ; . A cause de (5), ces deux caractères 
sont égaux en dehors des conjugués de S. 
Sur ces conjugués, leur différence est 
déterminée par (8). Ce type de résultat 
intervient, par exemple, dans la démons- 
tration par Feit et Thompson de leur 
célèbre théorème : « Tout groupe d’ordre 
impair est résoluble. » Feit et Thompson 
utilisent la théorie des caractères excep- 
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tionnels pour des isométries qui générali- 
sent (9). 
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E. Groupes de Lie 

La théorie des groupes de Lie, fondée dans 
la période de 1870-1880 par le mathéma- 
ticien norvégien Sophus Lie, a d’abord été 
considérée comme une partie assez mar- 
ginale des mathématiques, liée à des pro- 
blèmes touchant les équations différentiel- 
les, les équations aux dérivées partielles et 
la géométrie différentielle. Leur étude 
générale a mis plus tard en évidence un 
certain nombre d’objets mathématiques 
particuliers, explicitement définis, les grou- 
pes semi-simples , dont on a peu à peu 
découvert le rôle fondamental dans pres- 
que toutes les parties des mathématiques 
modernes, même les plus éloignées en 
apparence des vues initiales de Lie. En 
outre, ces groupes semblent intervenir de 
façon de plus en plus profonde dans les 
conceptions récentes de la physique théo- 
rique, surtout en théorie de la relativité et 
en mécanique quantique. 

On suppose connues les notions fonda- 
mentales relatives aux variétés différentiel- 
les et analytiques. On utilisera systémati- 
quement ici les notions introduites dans 
l’article sur les groupes classiques, qui 


constituent les premiers et les plus impor- 
tants exemples de groupes de Lie. 


1. La structure 

des groupes de lie généraux 

Un groupe de Lie (appelé aussi groupe de 
Lie réel) est, par définition, une variété 
analytique réelle G (dite SOUS-jacente au 
groupe), munie d’une loi de composition 
(Y, y)'-* xy pour laquelle G est un groupe, 
et qui est telle que l’application (Y, 
y) i— ► xy 1 de G X G dans G soit analy- 
tique. Une variété analytique complexe G 
munie d’une loi de composition 
(y, y) | — 1 - xy pour laquelle G est un groupe, 
et qui est telle que (y, y) | — 1 - Y y~ l soit une 
application holomorphe de G X G dans G, 
est appelée groupe de Lie complexe ; un tel 
groupe peut évidemment aussi être consi- 
déré comme groupe de Lie réel (dit SOUS- 
jacent au groupe de Lie complexe), en 
n’envisageant que sa structure de variété 
analytique réelle. Dans un groupe de Lie 
réel (resp. complexe) G, les translations 
Y ► ax, x ► Y a et les automorphismes 
intérieurs : 

Int(a) :x ^axa~ l 

sont des applications analytiques (resp. 
holomorphes) ; il en résulte que la dimen- 
sion (resp. la dimension complexe) de la 
variété sous-jacente à G est la même en 
tous les points de G ; on dit que c’est la 
dimension (resp. la dimension complexe) ch 
G ; si G est un groupe de Lie complexe de 
dimension complexe n , le groupe de Lie 
réel sous-jacent est de dimension 2 n. 

Un sous-groupe de Lie (resp. sous- 
groupe de Lie complexe) H d’un groupe de 
Lie (resp. groupe de Lie complexe) G est 
un sous-groupe de G dont l’ensemble 
sous-jacent est une sous-variété fermée de la 
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variété sous-jacente à G. On montre qu’un 
sous-groupe fermé d’un groupe de Lie G est 
nécessairement un sous-groupe de Lie de 
G (mais non nécessairement un SOUS- 
groupe de Lie complexe lorsque G est un 
groupe de Lie complexe). 

Ainsi, le groupe linéaire GL (n, R) 
(resp. GL(«, C)) est un groupe de Lie réel 
(resp. complexe) de dimension (resp. de 
dimension complexe) n 2 ; le groupe uni- 
modulaire SL (n, R) (resp. SL(«, C)) en est 
un sous-groupe de Lie (resp. un SOUS- 
groupe de Lie complexe) de dimension 
(resp. de dimension complexe) n 2 1. Le 
groupe orthogonal 0(n, R) (resp. 0(n, C)) 
est un sous-groupe de Lie (resp. un SOUS- 
groupe de Lie complexe) de GL(n, R) 
(resp. GL(/?, C) de dimension (resp. de 
dimension complexe) n(n — I)/2. 

Un homomorphisme / : G — ► G’ de 
groupes de Lie (resp. de groupes de Lie 
complexes) est un homomorphisme de 
groupes qui est en même temps une 
application analytique (resp. holomorphe). 
Le noyau f~\e) est un sous-groupe de Lie 
(resp. un sous-groupe de Lie complexe) de 
G. Par contre, l’image f(G) est un SOUS- 
groupe de G’ qui n’est pas nécessairement 
fermé. 

On se bornera, dans ce chapitre, aux 
propriétés des groupes de Lie réels ; 
lorsqu’on mentionnera un groupe de Lie 
complexe, par exemple GL (n, C), c’est en 
fait le groupe de Lie réel sous-jacent dont 
il sera question. 

Si N est un sous-groupe de Lie distingué 
d’un groupe de Lie G (donc fermé dans 
G), on peut définir sur le groupe G /N une 
structure et une seule de variété analytique 
qui en fait un groupe de Lie et pour 
laquelle l’application canonique : 

TT : G — G/N 

est une submersion. Si G et G’ sont deux 


groupes de Lie, la structure de variété 
produit sur G X G’ définit sur ce groupe 
une structure de groupe de Lie. Plus 
généralement, soit L et N deux groupes de 
Lie, et x »— ► l Y un homomorphisme du 
groupe L dans le groupe Aut(N) des 
automorphismes de N, tel que l’applica- 
tion (je, y) »— » ► T v (y) de L X N dans N soit 
analytique. Alors le produit semi-direct 
L X T N de L par N relatif à j est un 
groupe de Lie pour la structure de variété 
produit; N est un sous-groupe distingué 
fermé de L X T N, et le groupe quotient : 

(L X T N)/N 
est isomorphe à L. 

Les groupes de Lie de dimension 0 sont 
les groupes discrets. Dans un groupe de 
Lie G, la composante neutre (c’est-à-dire la 
composante connexe de l’élément neutre e 
de G) est un sous-groupe ouvert (donc à 
plus forte raison fermé) distingué G°, et le 
quotient G/G° est discret ; on notera que 
G n’est pas nécessairement produit semi- 
direct de G 0 et d’un sous-groupe isomor- 
phe à G/G°. L’étude des groupes de Lie se 
concentre presque exclusivement sur les 
groupes de Lie connexes. 

Pour un groupe de Lie connexe G, il 
existe un groupe de Lie simplement 
connexe G appelé revêtement universel de 
G, déterminé à un isomorphisme près, tel 
que G soit isomorphe à G/D, où D est un 
sous-groupe discret du centre de G, iso- 
morphe au groupe fondamental TT! (G) de 
la variété sous-jacente à G (le groupe 7T|(G) 
est donc toujours commutatif). La struc- 
ture des groupes de Lie connexes est donc 
ramenée à celle des groupes simplement 
connexes. 

Ainsi le groupe GL («, C) est connexe ; 
mais le groupe GL(«, R) a deux compo- 
santes connexes, la composante neutre 
étant l’ensemble des matrices de détermi- 
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nant strictement positif. Les groupes SL (fl, 
C) et SL (fl, R) sont connexes. Chacun des 
groupes 0(n, C) et 0(n, R) a deux 
composantes connexes ; les composantes 
neutres sont SO (fl, C) et SO (fl, R). 

Un groupe de Lie commutatif connexe 
est nécessairement isomorphe à un groupe 
du type X T q , où T = R/Z (« tore à 
une dimension ») ; son revêtement univer- 
sel est R^T Le groupe SL (fl, C) est 
simplement connexe, mais GL(fl, C) ne 
l’est pas : son revêtement universel est 
isomorphe à : 

SL(/t, C) X 

et son groupe fondamental isomorphe à Z. 
Le groupe SO(2, R) est commutatif et 
isomorphe à T ; pour n ^ 3, le groupe 
SO(fl, R) a pour revêtement universel le 
groupe Spin(fl) noté encore Spin(fl, R), et 
le groupe fondamental est d’ordre 2 ; on 
définit de même le groupe Spin(fl, C), qui 
est revêtement universel de SO (fl, C) pour 
fl > 3, avec encore un groupe fondamen- 
tal d’ordre 2. 

Dans un groupe de Lie simplement 
connexe G, les groupes dérivés successifs 
D’(G) sont des sous-groupes distingués 
fermés connexes ; il en est de même des 
sous-groupes C'(G) de la série centrale 
descendante. Un groupe simplement 
connexe résoluble G a une variété SOUS- 
jacente isomorphe à un espace R /J ; son 
groupe dérivé D(G) est nilpotent, et il 
existe une suite croissante (H,), 0 ^ j < n, 
de sous-groupes fermés distingués de G 
telle que H 0 = { e }, H„ = G et que 
soit isomorphe à R. Par exemple, 
le groupe trigonal large supérieur T(fl, R) 
formé des matrices réelles : 

{ Xij )G GL(»,R) 

telles que x tj = 0, pour i > j\ est un groupe 
simplement connexe résoluble. Son groupe 


dérivé est le groupe trigonalstrict supérieur , 
qui est formé des matrices de T(fl, R) telles 
que x (t = 1 pour tout i. Tout groupe de Lie 
résoluble simplement connexe est isomor- 
phe à un sous-groupe d’un groupe trigonal 
T(fl, R). On notera qu’un groupe résoluble 
de dimension 2 peut avoir son centre 
réduit à l’élément neutre, par exemple !e 
groupe des matrices réelles : 



où .Y > 0. 

Dans un groupe de Lie connexe G, il 
existe un plus grand sous-groupe résoluble 
connexe R distingué dans G, appelé le 
radical de G ; il est fermé dans G. Lorsque 
R est réduit à l’élément neutre, on dit que 
le groupe G est semi-simple. Pour un 
groupe de Lie connexe G. de radical R. 
S = G/R est semi-simple. Pour qu’un 
groupe connexe soit semi-simple, il faut et 
il suffit que son revêtement universel le 
soit. Un groupe de Lie simplement 
connexe G est produit semi-direct de son 
radical R et d’un groupe semi-simple L 
isomorphe à G/ R. Le centre d’un groupe 
semi-simple est discret. 

2. Groupes de Lie compacts 
et groupes semi-simples 

Soit G un groupe de Lie connexe ; il existe 
alors dans G un sous-groupe compact 
maximal K et un nombre fini de sous- 
groupes fermés H,, . . . . H /7 isomorphes à R, 
tels que l’application : 

(k,x li ..., Xp )^kx l „.x p 
du produit : 

K X Hj X X H, 

soit un isomorphisme de la variété SOUS- 
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jacente à ce produit sur la variété sous- 
jacente à G ; en outre, pour tout SOUS- 
groupe compact K, de G, il existe 5 G G 
tel que : 

jKjj-'CK, 

et en particulier deux sous-groupes com- 
pacts maximaux sont conjugués. Les pro- 
priétés topologiques de G (par exemple ses 
groupes d’homotopie ou d’homologie) 
sont donc connues lorsqu’on connaît les 
propriétés correspondantes de K. 

On peut citer deux exemples : dans 
SL (n, R), le groupe SO (n, R) est un 
sous-groupe compact maximal ; dans 
GL (n, C), le groupe U(n, C), aussi noté 
U(n), est un sous-groupe compact maxi- 
mal. 

Le revêtement universel d’un groupe de 
Lie compact K est de la forme K’ X R", 
où K’ est compact, semi- simple et simple- 
ment connexe. Tout groupe compact semi- 
simple et simplement connexe est produit 
direct de sous-groupes compacts simple- 
ment connexes et simples (c’est-à-dire 
n’ayant pas de sous-groupe fermé distin- 
gué distinct d’eux-mêmes et de dimension 
strictement positive) ; leurs centres sont 
finis, et les sous-groupes distingués fermés 
d’un groupe simple sont contenus dans le 
centre. 

Les groupes simples compacts simple- 
ment connexes sont explicitement connus 
(classification de Killing-É. Cartan) : il y a 
d’abord quatre séries infinies de groupes 
classiques (tabl. 1). 


Les groupes de types B, C peuvent être 
définis pour m ^ 1 et ceux du type D pour 
m ^ 2, mais on n’obtient pas de groupes 
essentiellement nouveaux, car on a les 
isomorphismes A, — Bj ~ C,, B-, — C 2 et 
A3 ~ D3, et le groupe de type D? est 
isomorphe au produit de deux groupes de 
type A,. Il faut enfin préciser que le groupe 
unitaire XJ(m, H) sur le corps des quater- 
nions H se rapporte à une forme unitaire 
positive non dégénérée. 

Il existe en outre cinq groupes excep- 
tionnels, notés : 

G 2 14 | 

F 4 52 §ï 

E 6 78 3 

E 7 133 2 

Eg 248 

(la seconde colonne indique la dimension, 
et la troisième, l’ordre du centre). 

On verra plus loin (chap. 2 , 3 et 4 ) 
d’autres précisions sur ces groupes. Men- 
tionnons ici que l’algèbre de cohomologie 
des groupes classiques est entièrement 
déterminée sur l’anneau des entiers ou sur 
un corps premier ; on connaît aussi les 
groupes d’homotopie : 

tt*(U(«, C)) 

pour k 2 n + 2 ; en particulier : 

7T*(U(«, C)) = z 
pour k impair <2 ni 

tt a (U(«, C)) = 0 


type 

dimension 

ordre du centre 

cas 

A, = SU (m + 1 , C) 

m(m + 2) 

m + 1 

m ^ 1 

Brn = $pin(2m + 1 . R) 

m(2m + i) 

2 

/77> 2 

Cm = U(m, H) 

m{2m + i) 

2 

m > 3 

Dm = Spin(2 m, R) 

m(2m — i) 

4 

/77> 4 


tabl. 1 Groupes classiques simples, compacts et simplement connexes 
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pour k pair <2 «, et 

7T 2 „(U(/î,C)) 

est cyclique d’ordre n ! ; on obtient des 
résultats analogues pour les groupes 
d’homotopie de SO(«, R) (théorèmes de 
Bott). 

Les groupes semi-simples complexes 
correspondent biunivoquement aux grou- 
pes semi- simples compacts, tout groupe 
semi-simple compact K étant sous-groupe 
compact maximal d’un groupe semi-simple 
complexe G, déterminé à isomorphie près, 
de dimension complexe égale à la dimen- 
sion de K et dont le centre est celui de K 
(cf. chap. 6 et 7). Pour les groupes com- 
pacts classiques, les groupes simples com- 
plexes simplement connexes correspon- 
dants sont les suivants : 

A, = SL (m + 1, C); 

B„, = Spin(2 m + 1, C) 

(revêtement universel de SO(2 m + 1 , C)) ; 

C m = Sp(2 m,C) ; 

D m = Spi n (2 m, C) 

(revêtement universel de SO(2 m , C)). 

La situation est plus compliquée pour 
les groupes semi- simples réels non com- 
pacts (et non sous-jacents à un groupe 
semi- simple complexe) ; ils peuvent avoir 
un centre infini (discret) et ne contenir 
aucun sous-groupe compact distinct de [e] 
(par exemple le revêtement universel de 
SL(2, R)). On se limitera ici aux groupes 
semi-simples réels dont le centre est fini (le 
quotient d’un groupe semi-simple par son 
centre, cf. chap. 5, a toujours un centre 
réduit a e). Un tel groupe G t . de dimension 
n est sous-groupe fermé d’un groupe semi- 
simple complexe G n bien déterminé à 
isomorphie près (le « complexifié » de G, 
cf. chap. 7), de dimension complexe n ; 
mais à un même groupe semi-simple com- 


plexe G’ correspondent plusieurs groupes 
semi-simples réels non isomorphes, dont 
G’ est le complexifié ; on dit que ces 
groupes sont les « formes réelles » de G’ ; 
une d’entre elles est toujours le groupe 
compact correspondant à G’. Cependant, 
si, par exemple, on considère, pour un 
entier m ^ 2 donné et pour chaque p tel 
que 1 ^ p ^ m, le groupe orthogonal réel 
unimodulaire : 

SO(p, 2 m — p) 

correspondant à une forme quadratique de 
signature (p, 2 m — p ), tous ces groupes 
sont des formes réelles, deux à deux non 
isomorphes, du groupe semi-simple com- 
plexe SO(2 m , C). Toutes les formes réel- 
les des groupes simples complexes ont été 
déterminées par E. Cartan. 

Un groupe semi- simple réel connexe 
non compact G admet toujours une décom- 
position d’Iwasawa G = KAN, où K est un 
groupe compact maximal de G, A un 
groupe commutatif fermé dans G, iso- 
morphe à un R", et N un groupe réso- 
luble simplement connexe (donc ayant 
une variété sous-jacente isomorphe à 
un R?) fermé dans G ; le centre de G 
est contenu dans KA ; en outre, l’applica- 
tion : 

( k , a, n ) •— * ► kan 

est un isomorphisme de la variété SOUS- 
jacente à : 

K X A X N 

sur la variété sous-jacente à G. Par exem- 
ple, si G = SL (n, R), on peut prendre 
pour K le groupe orthogonal SO («, R), A 
est le groupe des matrices diagonales de 
déterminant 1, et N le groupe trigonal 
strict. Si : 

G = SO (p 7 2m — p), 
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on peut prendre pour K le produit : 

SO(/>) x SO(2 m —p)- 

Revenons aux groupes de Lie compacts. 
Un tel groupe K contient des sous-groupes 
compacts connexes commutatifs , donc iso- 
morphes à des tores T A . Un tore maximal 
T dans K est son propre centralisateur 
(donc contient le centre de K) et, pour tout 
autre tore T’ C K, il existe un s G K tel que 
sTs~ l C T; en particulier, deux tores 
maximaux sont toujours conjugués dans 
K. En outre, tout élément de K appartient 
à au moins un tore maximal. Ainsi, dans le 
groupe unitaire U(n, C), un groupe com- 
pact maximal est formé des matrices dia- 
gonales : 

diag (e' 01 , e' 02 , e /0 *) ; 

le fait que la réunion des tores maximaux 
est U(n, C) équivaut ici à la classique 
réduction d’une matrice unitaire à la forme 
diagonale par similitude. 

La dimension m d’un tore maximal de 
K est appelée le rang de K ; lorsque K est 
simple, le rang est l’indice m affixé à la 
lettre A, B..., G dans la classification de 
Killing-Cartan. Le normalisateur N(T) 
d’un tore maximal T d’un groupe semi- 
simple compact K joue un rôle important : 
le groupe quotient W = N(T)/T est appelé 
groupe de Weyl du groupe K (cf. chap. 6). 


3. Actions des groupes de Lie 

Les groupes de Lie ont d’abord été étudiés 
en tant que groupes de transformations de 
certains espaces, plutôt que pour eux- 
mêmes ; et, dans la théorie moderne, les 
diverses façons dont un groupe de Lie peut 
être considéré comme groupe de transfor- 
mations jouent encore un grand rôle. Les 
actions ou opérations d’un groupe de Lie se 


définissent comme pour les groupes quel- 
conques (cf. la partie D ci-dessus Repré- 
sentation linéaire des groupes), mais on 
n’envisage d’ordinaire que des actions 
d’un groupe de Lie G sur une variété 
analytique X, et on exige que l’application 
(s, x) i — ► j x de G X X dans X soit 
analytique. Pour tout S G G, l’application 
X ’ > S x est alors un isomorphisme de la 
variété X sur elle-même ; pour tout x G X, 
l’ensemble S x des 5 G G tels que S X = X 
est un sous-groupe fermé de G appelé 
stabilisateur de x. L’orbite G x de x est 
l’ensemble des s X pour s G G ; les orbites 
sont les classes d’équivalence d’une rela- 
tion d’équivalence R dans G ; elles ne sont 
pas nécessairement fermées dans X et 
peuvent être en fait des ensembles très 
compliqués. Leur étude générale n’a guère 
été poussée que pour G = R ou G = Z, 

L’ensemble X/G des orbites ne peut en 
général être muni d’une structure de 
variété analytique telle que l’application 
canonique TT : X — ► X/G (qui fait corres- 
pondre à un point son orbite) soit une 
submersion ; pour qu’il en soit ainsi, il faut 
et il suffit que l’ensemble T R C X X X des 
couples (x, y) appartenant à une même 
orbite soit une sous-variété fermée de 
X X X ; toute orbite est alors une SOUS- 
variété fermée de X. 

Un cas ou la variété des orbites existe 
toujours est celui où G est un sous-groupe 
fermé d’un groupe de Lie H, le groupe G 
opérant dans H par translation à droite 
(s, x ) l— * XS avec S G G, x G H, de sorte que 
les orbites sont les classes à gauche a'G 
dans H. La variété des orbites H/G est 
alors appelée l’espace homogène des classes 
à gauche suivant G ; le groupe de Lie H 
opère à gauche sur H/G par (r, xG) 
* zxG. Lorsqu’un groupe de Lie G opère 
sur une variété X de sorte que la variété des 
orbites X/G soit définie, l’orbite d’un point 
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X est canoniquement isomorphe à l’espace 
homogène G/S v . 

Le fait pour une variété analytique de X 
de pouvoir être considérée comme espace 
homogène H/G d’un groupe de Lie H 
implique l’existence sur X d’une « géomé- 
trie » où se reflètent les propriétés des grou- 
pes H et G : c’est l’idée directrice exprimée 
d’abord par F. Klein dans son programme 
d’Erlangen, et la géométrie euclidienne 
classique n’apparaît plus ainsi que comme 
un exemple particulier des « géométries » 
associées aux groupes de Lie ; les plus inté- 
ressantes correspondent au cas où H est un 
groupe simple (cf. chap. 2) et on a par 
exemple développé ainsi les « géométries 
de Tits-Freudenthal » correspondant aux 
cinq groupes exceptionnels. 

Les espaces homogènes G/H les plus 
importants dans toutes sortes d’applica- 
tions sont les espaces riemamniens symé- 
triques irréductibles , découverts et entière- 
ment énumérés par É. Cartan au cours de 
recherches de géométrie riemannienne : ce 
sont les espaces de la forme G/ K, où G est 
un groupe simple réel de centre fini et K 
un sous-groupe compact de G, obtenu 
comme l’ensemble des x G G tels que 
a(/x) = x où g est une involution analytique 
de G (cf. chap. 7). Lorsque G est non 
compact, K est nécessairement un SOUS- 
groupe compact maximal de G, et G/K est 
difféomorphe à un espace R". Si l’on prend 
G = SL (fl, R), par exemple, K = SO(ft, 
R) est l’ensemble des matrices invariantes 
par l’involution C/ * — ü{U) = r U~ [ (contra- 
gédiente de U) ; pour n = 2, l’espace 
symétrique G/K s’identifie canoniquement 
avec le demi-plan de Poincaré formé des 
nombres complexes de parties imaginaires 
strictement positives, où la matrice : 



de G opère par : 

az + b 
z 1 * » 

cz + d 

avec a, b , c, d réels et ad bc = 1. Dans 
beaucoup de cas (entièrement déter- 
minés par É. Cartan), les espaces symé- 
triques G/K s’identifient ainsi à des 
ouverts d’espaces complexes C”, où G 
opère par transformations holomorphes, 
et ces espaces jouent un rôle impor- 
tant dans la théorie des fonctions de 
plusieurs variables complexes. Plus récem- 
ment, on a pu déterminer également 
les ouverts bornés de C n qui sont des 
espaces homogènes G/H (non nécessai- 
rement symétriques) où G opère par 
transformations holomorphes. Les sphères 
et les espaces projectifs sont aussi des 
espaces riemanniens symétriques irréduc- 
tibles. 


4. Représentations linéaires 
de dimension finie 
des groupes de lie 

Les définitions sont données à l’article 
précédent, qui traite de la représentation 
linéaire des groupes ; on se bornera aux 
représentations linéaires dans des espaces 
vectoriels V (de dimension finie dans ce 
chapitre) sur le corps C des nombres 
complexes ; en outre, les représentations 
linéaires p : G — ► GL(V) d’un groupe de 
Lie que l’on considère sont supposées 
analytiques (réelles). 

Lorsque le groupe de Lie G est connexe 
et résoluble , toute représentation irréduc- 
tible de G est de dimension 1, autrement 
dit de la forme s ■— * ^(s), °ù X est un 
caractère (abélien) du groupe commutatif 
G/D(G) ; une représentation quelconque 
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de G s’écrit toujours sous la forme trian- 
gulaire : 



' Xi(î) a 12 (s) .. 

* a ip{ S )\ 

s »-► 

0 X 2 CO 

<*2p(s) 


0 0 - 

■ Xp(s) / 


L’exemple de la représentation 
linéaire : 



de G = R montre qu’une représentation 
linéaire d’un groupe commutatif n’est 
pas nécessairement complètement réduc- 
tible. 

En revanche, toute représentation 
linéaire d’un groupe de Lie G compact ou 
réductif (c’est-a-dire dont le revêtement 
universel est produit d’un groupe semi- 
simple et d’un R") est complètement réduc- 
tilde (théorème de H. Weyl) ; pour les 
groupes compacts, c’est même vrai sans 
supposer que G est un groupe de Lie (cf. 
art. précédent). Tout revient donc à déter- 
miner, dans ces cas, les représentations 
irréductibles ; cette détermination a été 
complètement effectuée par E. Cartan au 
moyen de techniques qui seront esquissées 
dans le chapitre 6. 

La théorie des représentations linéaires 
des groupes semi- simples généralise la 
théorie classique des invariants en géomé- 
trie projective. 11 s’agissait uniquement, 
dans cette théorie, des représentations des 
groupes classiques, et surtout de SL(V). 
Ce groupe opère en effet naturellement 
dans toute puissance tensorielle V® w , et 
dans le sous-espace des tenseurs symétri- 
ques d’ordre n. Ce dernier s’identifie à 
l’espace vectoriel F„ des polynômes homo- 
gènes de degré n à p variables (si 
p = dim V) ; un élément s E SL(V) opère 


en transformant un tel polynôme P /? (.Vj, • • • • 
x p ) en le polynôme : 

J P„(* X p ) = ? H (?- l .X S~ l 'X p ), 

en posant y" 1 = ü^X j + ... -h a kp x p si 

J'" 1 est la matrice (cc,). Un invariant dans F„ 
est un polynôme tel que S = P n pour 
tout s (E SL(V) ; cela signifie que P n engen- 
dre dans F w un sous-espace stable de 
dimension 1, et, si l’on sait décomposer 
toute représentation linéaire en représen- 
tations irréductibles, on pourra obtenir 
tous les invariants. D. Hilbert avait démon- 
tré (pour SL(V)) qu’il y a un nombre fini 
de polynômes homogènes invariants Ij, I 2? 

I,. tel que tout autre invariant soit de la 
forme Q(I { , I 2 , I r ), où Q est un 
polynôme. Ce théorème s’étend à tous les 
groupes semi-simples (mais non à tous les 
groupes de Lie). 

Une représentation linéaire : 

p:G-GL (V) 

est dite fidèle si elle est injective. On peut 
prouver que, pour tout groupe de Lie 
connexe G, il existe un groupe connexe qui 
a même revêtement universel que G et qui 
est isomorphe à un sous-groupe d’un 
groupe linéaire GL(V) ; mais le revête- 
ment universel de G n’a pas toujours cette 
propriété (par exemple pour G = 
SL(2, R)). Toutefois, tout groupe compact 
et tout groupe semi- simple complexe est 
isomorphe à un sous-groupe d’un groupe 
linéaire. 


5. Algèbres de Lie 

L’outil essentiel dans la démonstration des 
remarquables résultats qui précèdent est la 
méthode infinitésimale, inaugurée par 
S. Lie ( 1842 - 1899 ), qui a pour effet de 
ramener l’étude des groupes de Lie à 
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l’étude de ce qu’on appelle leurs algèbres 
de Lie. L’idée est d’étudier les conditions 
qu’impose l’associativité de la loi d’un 
groupe G aux séries qui l’expriment dans 
un voisinage V de e. On suppose choisi un 
système de coordonnées locales qui 
s’annulent en e, de sorte que V est identifié 
à un voisinage de l’origine dans R*. Soit W 
un voisinage de 0 tel que W 2 C Y, et 
x=( Xi ,.,x„), y = O,, . •■,}’„) deux 
points de W; leur produit Z — Xy G \ 
étant fonction analytique de x, y par 
hypothèse, les coordonnées Zj , . . . . z n de z 
s’expriment par des séries convergentes 
pour | Xj | < p, | y) | < p, 1 <7 < n : 

(1) ij = <p j(x,y) 

= x i+y > + ^ 

|a|> MPI > 1 

1 < j ^ n, où l’on a employé la notion des 
multi-indices : 

a= (a,. . .,a„), 
x a = ... x“% 

a | = a, + a 2 + + a, 

(Cf. CALCUL INFINITÉSIMAL Calcul à plu- 
sieurs variables). Considérons alors une 
fonction analytique : 

f(x) =/(*!, 

donc développable en série convergente au 
voisinage de 0 ; si l’on substitue à chaque 
Xj la série z } = (fy (x, y) donnée par (1), on 
obtient une série en les x- } et y^ et, en 
groupant les monômes en x^V a pour un 
même a, on obtient ce qu’on peut appeler 
la formule de Taylor dans le groupe G au 
voisinage de e : 

(2) f(xy) . £ (ZJ{x))y\ 


où on vérifie aisément que : 

ZJ(x) = ^ )DS/(.x) 

p < a 

(combinaison d’un nombre fini de dérivées 
partielles de/ à coefficients a a $ analytiques 
au voisinage de 0). Les applications/»— > ► Zff 
sont donc des opérateurs différentiels sur les 
fonctions analytiques dans G ; en outre, ils 
ont la propriété fondamentale d’invariance 
à gauche par le groupe. De façon précise, 
pour tous ^ 6 G assez petit, posons 
f s (x) = / (sx). Un opérateur différentiel Z 
est dit invariant à gauche si Z (f s ) = (Z (/)/, 
pour s assez petit ; pour les Z a , cela résulte 
de leur définition (2) et de l’associativité, 
qui donne/(xj) =/((5X)j>)- Il est clair que 
l’ensemble <§> des opérateurs différentiels 
invariants à gauche est une algèbre associa- 
tive sur R, dont on voit aisément que les Z a 
forment une base sur R (Z 0 est pris égal à 
l’identité). En fait, la table de multiplication 
de la base (Z,) se détermine explicitement 
à l’aide des séries (1). On pose en effet, pour 
tout multi-indice y = (y„ . . . . y ) : 

(3) z ^ = (cpi(x,>0)^ - (<Pn(*>30) T " 

ct,P 

de sorte que = C’ a p £ ., où e j est le multi- 
indice (Ô,y), avec 1 ^ i ^ n ; de plus, on 
vérifie aussitôt que c a p Y — 0 pour 
a + p < y et que les seuls c a p Y non 
nuis tels que | y | = | a | + | p | sont ceux 
pour lesquels y = a + p, qui ont pour 
valeur : 

(a + 0! 

C a,M + P= Q | p, ’ 

avec a ! = a, ! ... a, !. Pour tout 5 assez 
petit, on peut écrire : 

f(sxy) = £ (Z f f(sx))y», 
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et, en vertu de la formule (2) appliquée en 
remplaçant f par Z : 

(4) f(sxy) = ^ ((Z„Z tf)(s))x°yf>. 

a, p 

Mais, d’autre part, on a aussi, par (2) : 
fisxy) = £ aj(s))m< 

T 

= Z (Z/W) (Z C aPY^ C< J ;P j î 

Y a, P 

d’où, en comparant à (4), les formules : 

(5) Z a Zp = ^ ' CgPyZy* 

Y 

qui donnent la table de multiplication. La 
comparaison des formules (3) et (5) mon- 
tre que la structure d’algèbre de <£ et la 
structure de groupe de G (si G est sim- 
plement connexe) se déterminent mutuel- 
lement sans ambiguïté. 

En particulier, en posant : 

Z,, = X„ bf : l i= b IJk , 

on tire de (5), en prenant a = P = : 

n 

(6) x ( x ; = z ti+E;+ g 6yAl 

1 ^ i ^ n et 1 ^ j ^ n ; et, en échan- 
geant i et j : 

(7) [X/, Xj] = XjXj — XjXj 

n 

= ^(b IJk -bj lk )X k , 
k = 1 

1 < / < n et 1 ^ j ^ n. 

Le sous-espace vectoriel g de de 
dimension n , admettant les X, pour base, 
est l’ensemble des opérateurs invariants à 
gauche d’ordre 1 ; les formules (7) mon- 
trent que g est stable pour l’opération : 

(X, Y) k* [X, Y] = XY — YX, 


qui vérifie les deux identités : 

(8) [X, Y] = — [X, Y], 

(9) [X, [Y, Z]] + [Y, [Z, X]] 

+ [Z, [X, Y]] = 0 

(identité de Jacobi). Un espace vectoriel 
sur un corps K dans lequel est défini une 
loi de composition : 

(m, v) — [ u , v ] 

vérifiant ces deux identités et bilinéaire est 
appelé algèbre de Lie sur K. Un homo- 
morphismef: g — ► g’ d’algèbres de Lie sur 
le même corps est par définition une 
application K-linéaire telle que : 

/([«,v])=[/»./(v)]. 

On a donc associé canoniquement à 
tout groupe de Lie G une algèbre de Lie g 
sur R, dite algèbre de Lie de ce groupe et 
notée Lie (G). 11 est très facile, en partant 
des formules (4) et (5) et des propriétés des 
c a de voir que les X, engendrent l’algèbre 
associative <§ ; de façon précise, les monô- 
mes : 

X 0 = XJ'XJ 2 ... X“" 

forment une base de l’espace vectoriel 
(l’ordre des facteurs dans les X a est bien 
entendu essentiel). De plus (g est entière- 
ment déterminée à isomorphie près 
lorsqu’on connaît g, car elle est caractéri- 
sée par la propriété « universelle » sui- 
vante : Pour toute application hnéairefde 
g dans une R-algèbre associative A telle 
que : 

/([X, Y]) =/(Xy(Y) — /(Y/ (X), 

il existe un homomorphisme d’algèbres F 
de dans A et un seul qui prolonge / 
Lorsque G est un groupe de Lie com- 
plexe, son algèbre de Lie g est une algèbre 
de Lie sur le corps C ; quand on la 
considère comme algèbre de Lie sur R, elle 
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est l’algèbre de Lie du groupe réel sous- 
jacent à G. 

Voici quelques exemples. Si G = R", 
on a : 


et (2) est la formule de Taylor usuelle ; 
l’algèbre associative # s’identifie à l’algè- 
bre des polynômes en les D„ UjO; 
l’algèbre de Lie correspondante est com- 
mutative, c’est-à-dire que [X, Y] = 0 quels 
que soient X, Y dans g. L’algèbre de Lie 
du groupe des matrices : 



a une base de deux éléments X, Y vérifiant 
la table de multiplication [X, Y] = -Y. 
L’algèbre de Lie gl(fl, R) (resp. gl («, C)) du 
groupe linéaire GL («, R) (resp. GL(fl, C)) 
s’identifie canoniquement à l’espace des 
matrices carrées réelles (resp. complexes) 
d’ordre n où le crochet est l’application 
(X, Y) XY — YX ; l’algèbre de Lie de 
SL(fl, R) est la sous-algèbre de Lie R) 
de gl («, R) formée des matrices de trace 0. 
En particulier, fl(2, R) (ou fl(2, C)) a pour 
base les trois matrices : 


universel (à isomorphie près). Cette cor- 
respondance permet d’établir un « diction- 
naire » entre les notions fondamentales de 
la théorie des groupes de Lie et des notions 
de la théorie des algèbres de Lie, qui 
relèvent essentiellement de l’algèbre 
linéaire (pour deux sous-espaces vectoriels 
a, b d’une algèbre de Lie 5, on note dans 
ce qui suit [a, b] le sous-espace vectoriel 
engendré par les [X, Y] pour X G a, Y G b) 
selon le tableau 2. 

Pour touts G G, il correspond à P auto- 
morphisme intérieur Int(s) : x ► SXS~ 1 de G 
l’automorphisme dérivé (Int(iï))* de g, noté 
Ad(s) ; l’application s i— * Ad(s) de G dans 
GL(g) est une représentation linéaire de G 
dans l’espace vectoriel g, appelée représen- 
tation adjointe ; son noyau est le centre Z de 
G et son image Ad(G) C GL(g), isomor- 
phe à G/Z, est appelée le groupe adjoint de 
G. On montre que la représentation linéaire 
Ad, de g dans gl(g) est l’application 
X * * ad(X), où on pose : 

ad(X)(Y) = [X,Y]; 

cette application est dite représentation 
adjointe de 5 ; son noyau est le centre } de 
5 et, pour tout XE g, ad(X) est une 
dérivation de l’algèbre 5, c’est-à-dire : 


;) h; » 


vérifiant donc la table de multiplication : 

(10) [H,X] = 2 X, [H, Y] = -2 Y, 

[X, Y] = H. 

On montre que réciproquement, à toute 
algèbre de Lie 5 sur R (resp. C) de 
dimension finie, correspond un groupe de 
Lie réel (resp. complexe) simplement 
connexe et un seul à isomorphie près, dont 
l’algcbrc de Lie est isomorphe à g. Tous les 
groupes de Lie connexes ayant la même 
algèbre de Lie ont même revêtement 


ad(X)[Y, Z] = [ad(X)(Y), Z] + [Y, ad(X)(Y)], 

ce qui n’est autre que l’identité de Jacobi. 

Pour tout X G g, il existe un homomor- 
phisme et un seul du groupe additif R dans 
G, dont l’homomorphisme dérivé soit 
r I — ► /X ; on note cet homomorphisme 
exp(7X) et l’image de R par cet 
homomorphisme est appelée le SOUS- 
groupe à un paramètre de G correspondant 
à X. Un tel sous-groupe n’est pas néces- 
sairement fermé dans G ; ainsi, par exem- 
ple, si G — T 2 et si cp : R >— ► T est l’homo- 
morphisme canonique, alors t ► (<p(t), 
cp(0f)), où 0 est un nombre irrationnel, 
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groupe de Lie simplement connexe G algèbre de Lie g 

homomorphisme dérivé f* g *•> g d’algèbres de 

Lie défini oar : 

homomorphisme f;G-*-G’de groupes de Lie (f (X)) (<ç) — X(cp 0 /) 

simplement connexes ' ' ' 

pour tout opérateur X Ç g et toute fonction diffé- 
rentiable Cp sur G' 

image de f 

Image de f* (sous-algèbre de g’) 

composante neutre du noyau de f (sous-groupe 
distingué fermé) 

noyau de (idéal de û, c’est-à-dire sous-espace 

û Cg tel que : 

[X, Y] G a pourxeg, YEû 

quotient G /N de G par un sous-groupe distingué 
fermé N 

quotient g/n de l’algèbre de Lie de G par celle de 
la composante neutre de N 

composante neutre du centre 

centre (idéal 3 des X tels que (X, Y] = 0 pour tout 

Y£9) 

groupe commutatif 

algèbre de Lie commutative 

sous-groupe (G, H) pour un sous-groupe distingué 
fermé connexe H de G (le groupe (G, H) est engen- 
dré par les ghg~ l h~ 1 pour g E G, h E H) 

idéal [g, t)] formé des combinaisons linéaires des 

[X, Y] pour X 6 g, Y G f) 

groupe dérivé (ou groupe des commutateurs) 

algèbre dérivée [g. g] de g 

produit direct G x G’ 

produit direct g X g’, avec : 

[(X, X'),(Y. Y')] = ([X,Y], [X',Y]) 

produit semi-direct 

produit semi-direct d’un idéal a et d’une soUS- 
algèbre b, avec : 

g = û 0 b 

représentation linéaire de G dans V : 

P : G GL(V) 

représentation linéaire de g dans V: 

p*: g-gi(V) 

tabl. 2 ’ Correspondance entre la théorie des groupes de Lie et f, a théorie des algèbres de Lie 


définit un sous-groupe à un paramètre 
partout dense dans T 2 . On a : 

exp((t + t’)X) = exp (t X) exp(/'X), 
exp (s ( t X)) = exp (( st )X) ; 

par contre, si X et Y sont tels que 
[X, Y] ^ 0, on a en général : 

exp (t (X + Y)) ^ exp (/ X) exp(/ Y). 

On montre qu’il existe un voisinage 
assez petit V de 0 dans g tel que Y appli- 


cation exponentielle X >— ► exp(X) de g dans 
G, restreinte à V, soit un isomorphisme 
analytique de V sur un voisinage ouvert de 
e ; mais en général, l’application 
X >— ► exp(X) n’est ni injective ni surjective 
dans g. Elle est toutefois surjective lorsque 
G est compact, et bijective lorsque G est 
résoluble et simplement connexe. On 
prouve, en outre, que : 

(11) Ad(exp(X))= exp(ad(X)) 
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pour X E g, l’exponentielle du second 
membre étant la série usuelle : 

exp(A) = ^ —'A” 

n = 0 

dans l’algèbre des matrices. 


6. Algèbres de Lie semi-simples 

La notion d’algèbre de Lie résoluble (resp. 
nilpotente) se définit comme pour les 
groupes, en remplaçant les groupes D’(G) 
(resp. C r (G)) par les idéaux formés de la 
façon correspondante dans l’algèbre de 
Lie g. Si G est un groupe de Lie simple- 
ment connexe, R son radical, le plus grand 
idéal résoluble X de l’algèbre de Lie g de G 
est l’algèbre de Lie de R, et on l’appelle le 
radical de g. Une algèbre de Lie g est dite 
semi-simple si son radical est réduit à {0} 
(ou, ce qui revient au même, si elle ne 
contient pas d’idéal commutatif non réduit 
à {0}. Un groupe de Lie connexe est 
semi- simple si et seulement si son algèbre 
de Lie est semi-simple. 

On définit d’autre part sur toute algèbre 
de Lie réelle (resp. complexe) g une forme 
bilinéaire symétrique réelle (resp. com- 
plexe) diteforme de Killing, par la formule : 

(X | Y) = Tr(ad(X)ad(Y)). 

Cette forme est étroitement liée à la 
structure de g par les trois critères de 
Cartan \ 

Pour que g soit résoluble, il faut et il suffit 
que (Xj Y) — 0 pour X E g et Y E [g, g]. 
Pour que g soit semi- simple, il faut et il 
suffit que la forme de Killing soit non 
dégénérée. 

Pour qu’une algèbre de Lie réelle g soit 
l’algèbre de Lie d’un groupe compact, il 
faut et il suffit que (X|X) ^ 0 dans g. 


On peut parvenir à la détermination de 
la structure d’un groupe compact semi- 
simple G, en analysant sa représentation 
adjointe. Il est commode de commencer 
par étendre canoniquement chaque endo- 
morphisme Ad(s) (pour s E G) de l’algè- 
bre de Lie g à un endomorphisme de sa 
complexifiée gç = g OR C, de sorte qu’on 
peut considérer G comme opérant par 
s-Ad(s) soit sur g, soit sur g c . L’idée 
fondamentale est de restreindre la repré- 
sentation adjointe à un tore maximal T 
de G ; comme T est compact et commu- 
tatif et que la forme de Killing est inva- 
riante par tout automorphisme de g et 
négative non dégénérée, cette représenta- 
tion est complètement réductible, donc g se 
décompose en somme directe de SOUS- 
espaces E^, deux à deux orthogonaux pour 
(X | Y), de dimension 1 ou 2 sur R, et 
stables par Ad(s), s E T ; mais le cas 
dim(E i ) = 1 est à exclure, car le groupe à 
un paramètre engendré par un élément de 
commuterait alors avec T, contraire- 
ment à l’hypothèse que T est maximal. 
Alors : 

E* ® R C 

est somme directe de deux sous-espaces E ' k 
et E " k de dimension 1 sur C, dans lesquels 
on a : 

Ad(s) X’ = (s)X r , 

Ad(s). X” = Xk (s)X" 

respectivement, où Xk est un caractère de 
T ; en vertu de (1 1), il revient au même de 
dire que, pour tout 

H E ï) = t <8> R C, 

t = Lie(T), on a : 

(12) [H, X’] = aAHjX dans El- 

[H, X”] = — a*(H)X" dans E* 

avec Xk( QX p(H)) = exp 2 nia k (H), où a k 
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est une forme linéaire non identiquement 
nulle sur f), à valeurs réelles dans t ; on dit 
que les sont les racines de gc relative- 
ment à la sous-algèbre commutative maxi- 
male j). L’identité de Jacobi et le fait que 
\) est maximale montrent que [E^, 
E "JC fl ; on constate alors que la somme 
directe : 


e; e e; e k, e;] 


est une sous-algèbre de avec une base 
vérifiant (10), elle est donc isomorphe à 
[1(2, C). Une analyse élémentaire des repré- 
sentations irréductibles de fl(2, C) permet 

d’obtenir les résultats fondamentaux sui- 
vants : toutes les racines (1 k ^ 
( n m)l 2 si n = dim G, ïïl = dim T) sont 
distinctes ; on peut donc prendre leur 

ensemble R comme ensemble d’indices, 
écrire g a et g_ a au lieu de E'^ et E"*, et 
déterminer dans chaque g a un élément X a , 
de sorte que, si l’on pose : 

(13) H a = [X a , X_ a ] E t, 

on obtienne : 

(14) a(H a ) = 2. 


En outre, pour deux racines quelcon- 
ques a, p, le nombre (3(H W ) est égal àp q , 
où p et q sont deux entiers positifs ou nuis 
tels que les entiers k vérifiant — p ^ k ^ q 
soient exactement ceux pour lesquels 
P -f - ka est une racine (on montre qu’on a 
toujours p -E q ^ 3) ; enfin : 


(15) 


[X.,X f ]=0 

si a + P n’est pas une racine, 
[X a , Xp] = N a pX a + p 

si a + P est une racine, 


et l’on peut montrer que : 

(16) N__ a( _p = — N a p et N a p = ± (p + 1), 

où l’entier p a été défini ci-dessus (base de 


Weyl-Chevalley) ; les H ü engendrent t et 
l’on obtient : 

(17) a(H) = (H H,) pour HE &. 

On prouve, à l’aide de ces relations, que 
l’application : 

(18) * Œ :p~P-P(H a )a 

est une permutation involutive de l’ensem- 
ble R des racines ; de plus, si a G R, on a 
2a (2 R. La détermination complète des 
ensembles finis R contenus dans le dual b* 
de l’espace vectoriel f), ne contenant pas 0, 
engendrant |j* et ayant les deux propriétés 
précédentes (ensembles dénommés systè- 
mes de racines) est essentiellement un 
problème de géométrie élémentaire, qui 
conduit à la classification de Killing- 
Cartan (cf. chap. 2). 

Ainsi, pour le type A„„ qui correspond 
à l’algèbre de Lie : 

i\(m + 1, C) 

du groupe unimodulaire, on peut prendre 
pour b l’algèbre de Lie engendrée par les 
éléments En — E j} (E^ est la matrice ayant 
un seul élément ^ 0, situé dans la h-ième 
ligne et la k-ième colonne, et égal à 1) ; les 
racines a f j correspondent aux couples (/,/) 
tels que i ^ j\ avec a j, ~ ; on a : 



°ù;(^ a A*) — 


si ni h ni k ne sont égaux à l’un des indices 
U j> et 

a ÿ(^a**) = * 

si h — i et j ^ k, ou h ^ i et j = k. On 
peut vérifier sur cet exemple les formules 
générales données plus haut. 

Les racines a appartiennent en fait au 
dual t* de l’espace vectoriel réel t ; si on 


575 



GROUPES 


définit sur t* la forme bilinéaire inverse de 
(U V) sur t, qu’on note (ç, q), la permu- 
tation s a est la restriction à R de la réflexion 
orthogonale par rapport à l’hyperplan M a 
des ç G t* tels que ç(H a ) = 0. Les S a pour 
a G R engendrent un groupe fini de trans- 
formations orthogonales, canoniquement 
isomorphe au groupe de Weyl W de G (cf. 
chap. 2) auquel on l’identifie. Les compo- 
santes connexes, dans l’espace t*, de la 
réunion des hyperplans M a sont appelées 
les chambres de g (relatives à t) ; pour une 
chambre C, il y a exactement m hyperplans 
M a tels que la réunion des M a H C cons- 
titue la frontière de C (donc C est un 
« angle polyèdre » dans l’espace t* à m 
dimensions) ; on dit que ces hyperplans 
M„ sont les murs de C. Si on choisit une 
chambre C, et qu’on note M,(l ^ i ^ m) 
ses murs, pour chaque i une des deux 
racines opposées orthogonales à M,- est du 
même côté que C de M, ; elle est notée oq 
et on dit que les a, (qui forment une base 
de l’espace vectoriel t*) forment une buse 
du système de racines R. On prouve que 
toute racine (X G R est combinaison 
linéaire des a, à coefficients entiers de 
même signe; les racines de R sont ainsi 
divisées en deux classes, dites positives 
(resp. négatives ) pour C si tous les coeffi- 
cients sont ^ 0 (resp. 0). Le groupe de 
Weyl permute les chambres (donc aussi les 
bases de R) de façon simplement transitive. 
Donnons un exemple : pour le type A„„ on 
peut prendre comme base les racines a^+j 
pour 1 ^ i ^ m ; donc le groupe de Weyl 
s’identifie au groupe symétrique des 

permutations de m + 1 objets. 

Supposons G simplement connexe. On 
a vu que les représentations linéaires de G 
dans un espace vectoriel complexe V 
correspondent biunivoquement aux repré- 
sentations linéaires de g dans V, et aussi 
(puisque Y est un espace vectoriel com- 


plexe) à celles de dans V ; ces dernières 
sont donc complètement réductibles, et il 
suffit de déterminer les représentations 
irréductibles de g c . On utilise la même idée 
que ci-dessus, savoir la restriction à [) d’une 
représentation p de g c dans V ; on appelle 
poids de la représentation p (irréductible 
ou non) tout élément G) G ()* pour lequel il 
existe un vecteur x G V non nul et pour 
lequel : 

p(H) . x = ü(H)a: 

pour tout H G fl (donc X est vecteur propre 
commun à tous les endomorphismes 
p(H)) ; l’ensemble V w des vecteurs X ayant 
cette propriété pour un poids (0 est un 
sous-espace vectoriel V (i) et V est somme 
directe des V CJ . Les poids de p sont donc en 
nombre fini ; si l’on suppose maintenant p 
irréductible et si l’on choisit une base (a/) 
de R, avec 1 ^ i ^ w, on démontre qu’il 
existe un unique poids TT de p tel que tous 
les autres poids de p soient de la forme : 



où les q i sont des entiers positif ; on dit que 
tt est le poids dominant de la représentation 
p, et on montre que V ff est de dimension 
1. Deux représentations irréductibles de 5c 
ayant même poids dominant sont sembla- 
bles. Pour qu’une forme linéaire 0) E ()* 
soit poids dominant d’une représentation 
irréductible de g c , il faut et il suffit que l’on 
ait o)(H a/ ) ^ 0 pour 1 ^ i ^ m. Les poids 
dominants de toutes les représentations 
irréductibles de 5 C forment donc un 
Z-module libre P(R), ayant pour base les 
poids TT ; (1 ^ i m) tels que : 

ÏT/(H 0| .) = 1, 7T/(H a .) = 0 

pour i j ; les 7r ; - sont appelés les poids 
fondamentaux de g c (pour la base (a,)) ; on 
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a évidemment R C P(R) et le sous-groupe 
Q(R) engendré par R est d’indice fini dans 
P(R) ; on prouve que le quotient P(R)/ 
Q(R) est isomorphe au centre de G (sup 
posé simplement connexe). 

Ainsi, pour le type A„„ les poids fon- 
damentaux (j) { (1 < i m) sont donnés 
par : 

w i (diag(r ! , . . . . + = t x + t 2 + + 

qui est une fonction restreinte à la SOUS- 
algèbre [) des matrices diagonales telles que : 

m + i 

i - 1 

On vérifie que ü)j, est le poids dominant 
de la représentation identique : 

*l(m + 1, C) “► il {m + 1, C) ; 

on montre que 0)^ est le poids dominant de 
la représentation canonique dans la puis- 
sance extérieure j-ième de C m+1 . 

Le caractère (cf. art. précédent) de la 
représentation irréductible du groupe com- 
pact semi- simple G de poids dominant ù) 
est donné par la formule de H. Weyl : 

y e(w) exp 2 7n>(o) + n) 

(19) Xo = — 

E(w ) exp 2 7T2 w (o) 

we w 

où (J est la demi-somme des racines posi- 
tives, VV parcourt le groupe de Weyl et e(vv) 
est son déterminant (égal à ± 1 suivant que 
VV est produit d’un nombre pair ou impair 
de réflexions s a ) ; le caractère apparaît 
comme une fonction définie dans l’algèbre 
de Lie t de T, mais a la même valeur pour 
tous les éléments H G t tels que exp(H) G 
T ait la même valeur dans T (cela résulte 
de ce que a est la somme des poids 
fondamentaux 0)-) ; en fait, est donc 


définie dans T, et, comme tout élément de 
G est contenu dans un conjugué de T, 
est bien définie dans G. 

En particulier, la dimension de l’espace 
de la représentation irréductible de poids 
dominant o) s’obtient en prenant la valeur 
de (H) pour H = 0, et on montre que 
cette valeur est : 

<»> 

(produit étendu aux racines positives). 

7. Algèbres semi-simples 
complexes et leurs formes réelles 

Dans le chapitre 6, en partant de l’algèbre 
de Lie d’un groupe semi- simple compact, 
on a obtenu, en la complexifiant, une 
algèbre de Lie semi- simple complexe. Ce 
processus admet une réciproque, qui éta- 
blit une correspondance biunivoque entre 
groupes connexes semi-simples complexes 
et groupes connexes semi- simples com- 
pacts . 

L’unique méthode connue pour établir 
ce fait est due à Killing et É. Cartan, et est 
fort longue : on commence par démontrer, 
dans une algèbre semi-simple complexe ff 
de dimension U sur C, l’existence d’une 
sous-algèbre commutative maximale f) 
(sous-algèbre de Cartari) telle que la rela- 
tion ad(X)(h) C b entraîne X G (j- En 
étudiant la représentation adjointe H 
ad(H) de I) dans l’espace vectoriel S. on 
arrive alors à décomposer g en somme 
directe de f| et de sous-espaces CX, de 
dimension 1, où les X a vérifient les rela- 
tions (13) à (16). On voit aisément que 
l’espace vectoriel réel u engendré par les 
/H tt , les X a — X„ a et les /(X M + X tt ) est 
une algèbre de Lie réelle dans laquelle la 
forme de Killing est négative non dégéne- 
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rée ; donc u est l’algèbre de Lie d’un 
groupe compact semi-simple U , et 
g = U 0 /U, Les /H a engendrent une sous- 
algèbre (réelle) commutative maximale t de 
II (correspondant à un tore maximal T de 
U), et on a ï) = t © it. 

Si l’on choisit une base (oc,), avec 
1 < j ^ m, du système des racines de g, la 
sous-algèbre (complexe) n + (resp. n ) de g 
ayant pour base les X a pour a > 0 (resp. 
a < 0) est une sous-algèbre nilpotente : on 
a : 

B = b © n+ 0 n-, 

et i] = 1) © n + est une sous-algèbre résoluble 
maximale de g. Si G est un groupe de Lie 
(complexe) connexe d’algèbre de Lie g et 
B le sous-groupe connexe de G correspon- 
dant à b, B est donc un sous-groupe 
résoluble connexe maximal de G. Les 
sous-groupes ayant ces trois propriétés 
sont appelés sous-groupes de Borel de G ; 
ils sont tous conjugués dans G. On montre 
que B est son propre normalisateur dans 
G, et que l’espace homogène G/B est 
compact et peut canoniquement être muni 
d’une structure de variété algébrique pro- 
jective sur C. En outre, les doubles classes 
BiB forment une partition de G qui est 
canoniquement indexée par le groupe de 
Weyl W de U (décomposition de Bruhat) : 
de façon précise, pour tout w G W, il existe, 
dans le normalisateur de T dans U, un 
élément n n . tel que Ad(«, r ) laisse stable 1) et 
induise sur \) la contragrédiente de w 
considéré comme opérant dans jj* (cf. 
chap. 6) ; l’application w 1—1 - B /2 M B est une 
bijection de W sur l’ensemble des doubles 
classes modulo B. 

Dans SL (w, C), par exemple, un groupe 
de Borel est le groupe trigonal large 
supérieur T (/7, C) (cf. chap. 1). 

Le groupe de Borel permet de donner 
une expression explicite de la représenta- 


tion linéaire de G correspondant à une 
représentation linéaire de g de poids domi- 
nant w. Supposons, pour simplifier, G 
simplement connexe, et soit M le SOUS- 
groupe connexe de G correspondant à t), 
qui est isomorphe à (C*)'" (« groupe de 
type multiplicatif ») ; on déduit de w un 
homomorphisme : M — ► C* défini 
par : 

ip to (exp(H)) = exp 2/7T(i)(H), 

coïncidant dans T avec le caractère ; si 
N + est le sous-groupe de B correspondant 
à n + , on a B = M N + et on prolonge lp (i) 
en un homomorphisme de B dans C* en lui 
donnant la valeur 1 dans N + . Soit alors V w 
l’espace vectoriel des fonctions /holomor- 
phes dans G et vérifiant l’identité : 

(21) f(xb) = iM*m 

pour x G G et b G B. On peut faire opérer 

linéairement G dans V w en posant : 

(22) (s ./)(*) =f(s~'x ), 

pour s , x dans G. On prouve que V () est de 
dimension finie, que la représentation de G 
dans Vo ainsi définie est irréductible et que 
sa contragrédiente a pour caractère 

On dit qu’une algèbre semi-simple g 0 
sur R est une forme réelle de g si g est 
isomorphe à la complexifiée : 

5o 

de go ; il est immédiat qu’il revient au 
même de dire que g 0 est isomorphe à une 
sous-algèbre de Lie réelle de g (g étant 
considérée comme algèbre de Lie réelle de 
dimension 2/7), formée des éléments inva- 
riants d’une conjugaison de g, c’est-à-dire 
une application semi-linéaire bijective <j de 
g sur elle-même qui préserve le crochet, 
telle que a 2 = 1. Tout revient donc à 
déterminer ces conjugaisons, à automor- 
phismes de g près. On montre d’abord que, 
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par un automorphisme de g, on peut 
ramener l’algèbre u à être stable par g. 
Alors to = go H U est la sous-algèbre de u 
formée des points fixes de la restriction de 
a, et u est somme directe de tg et du 
sous-espace z'p 0 des X £ U tels que 
o(X) — -X. D’autre part, u est l’ensem- 
ble des points fixes d’une conjugaison r de 
g, qui permute à a ; on a = Iq ® p 0 et p 0 
est l’ensemble des X 6 5o tels que 
l(X) = — X. On voit que la restriction à t 0 
(resp. Pq) de la forme de Killing de ^ est 
négative (resp. positive) non dégénérée ; 
une telle décomposition g 0 = ^ ® p 0 ayant 
toutes ces propriétés est appelée décompo- 
sition de Cartan de la forme réelle g 0 de g ; 
elle est déterminée à un automorphisme 
près de la forme Ad(s). 

Une fois connu un groupe semi- simple 
compact U, la détermination des formes 
réelles de son complexifié G revient donc 
à la détermination des automorphismes 
involutifs s de U (dont a, restreint à u, sera 
l’automorphisme dérivé s*). Si K est le 
sous-groupe compact de U formé des x 
invariants par s 9 sa composante connexe 
K 0 correspond à Iq ; d’autre part, si P est 
la composante connexe de e dans l’ensem- 
ble des X G U tels que s(x) = x -1 (qu’on 
montre être égale à exp(/p 0 )), on a 
U = K,. P; le groupe U agit sur P 
transitivement par : 

(«,/?)•— ups(u~ l ) t 

et P est isomorphe à l’espace riemannien 
symétrique U/ K. En outre, l’application 
(k, p) kp restreinte à un ouvert partout 
dense convenable de K 0 X P, est un dif- 
féomorphisme sur un ouvert partout dense 
de U. Si A désigne un sous-groupe com- 
mutatif maximal de P (A est ici un tore), 
011 prouve que tout p G P s’écrit kàk~ x 
pour un a G A et k G K 0 , d’où 
U = K 0 AK 0 (décomposition de Cartan). 


Par exemple, si U = S 0(3, R), groupe 
des rotations de R\ on peut prendre pour 
S l’automorphisme t »— ► rtr~\ où r est une 
réflexion orthogonale ; alors K = 0(2, R) 
et Kq = SO(2, R); A est un tore de 
dimension 1, comme K 0 , et la décompo- 
sition K 0 AK 0 n’est autre que la classique 
description des rotations de R 3 par les trois 
angles d'Euler . 

De la même manière, si G 0 est la forme 
réelle (non compacte) correspondant à a, 
c’est-à-dire le sous-groupe connexe de G 
correspondant à l’algèbre de Lie gg, la res- 
triction de T à g 0 est de la forme t *, où t est 
un automorphisme involutif de Gq ; Kq est 
l’ensemble des x G Gq invariants par t , et 
Pq = exp(p 0 ) la composante connexe de e 
dans l’ensemble des x G Gq tels que 
t (x) = x -1 ; on obtient G 0 = K 0 P 0 , et ici 
l’application (k, p) ► kp de Kq X Pq sur 
Gq est un difféomorphisme. L’espace P est 
isomorphe à un R” ; Gq y agit transitive- 
ment par (x, p) ► xpt(x l ), et, pour cette 
action, P 0 est isomorphe à l’espace rieman- 
nien symétrique Gq/Kq. On a encore la 
décomposition de Cartan Gq = KqAqKq 
(A, sous -groupe commutatif connexe maxi- 
mal de Pq), et, en analysant de plus près la 
représentation adjointe de A dans Sq, on 
obtient la décomposition d’Iwasawa 
G 0 = K 0 A 0 N décrite dans le chapitre 2. 

On voit notamment que les espaces 
riemanniens symétriques compacts simple- 
ment connexes sont en correspondance 
hiunivoque avec les espaces riemanniens 
symétriques non compacts. 

8. Représentations linéaires 
de dimension infinie 

La description des représentations irréduc- 
tibles d’un groupe semi-simple complexe 
donnée dans (21) et (22) est un exemple 
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particulier de l’idée fondamentale de repré- 
sentation linéaire induite, initialement 
introduite par Frobenius pour les groupes 
finis, (cf. la partie D ci-dessus Repré- 
sentation linéaire des groupes), appliquée 
aux groupes de Lie. 

D’une façon générale, soit G un groupe 
de Lie, F un sous-groupe fermé de G, F un 
espace vectoriel complexe de dimension 
finie, et £•—►/,(£) une représentation 
linéaire de F dans F. Soit alors V un espace 
vectoriel (en général de dimension infinie) 
de fonctions définies dans G et vérifiant 
l’identité : 

(23) /(*£) = £(£)./(*) 

pour „v G G et ç G F. On fait alors opérer 
G dans V en posant : 

(24) (s ./)(*) =f(s~ 1 s) 
pour s , x dans G. 

L’exemple des représentations de 
dimension finie donné dans (21) et (22) 
correspond au cas où L est une représen- 
tation de dimension 1 et où Y est de 
dimension finie. Le cas le plus étudié en 
dehors de ce dernier est celui où L est une 
représentation unitaire (autrement dit, 
L(E,) laisse invariant un produit scalaire 
euclidien dans F) ; si f’ vérifie (23), on a 
| f (x£) | = ||/ (x) | pour la norme eucli- 
dienne dans F, et on peut considérer / 
comme définie dans G /T ; on définit alors 
V comme l’espace de Hilbert des fonctions 
f Slir G/r telles que : 

(25) f ]/ (z) || 2 ü?mOO < + °°, 

J G/r 

où p est une mesure sur Gr invariante 
pour l’action de G. Il s’agit de savoir si 
cette représentation est irréductible, ou de 
la décomposer en représentations irréduc- 
tibles ; cela pose des problèmes difficiles 
qui sont encore loin d’être tous résolus. 


Leur intérêt réside dans le fait qu’ils 
rattachent à la théorie des groupes de Lie 
des questions d’analyse ou de physique 
d’allure toute différente. 

En premier lieu, on rencontre ainsi de 
façon naturelle de nombreuses fonctions 
spéciales, dont on peut ainsi faire une 
théorie unifiée et « expliquer » maintes 
propriétés qui paraissaient fortuites. 

Les exemples les plus simples s’obtien- 
nent lorsqu’on prend G = U. groupe 
compact semi-simple, et Y = K 0 (nota- 
tions du chap. 7). Alors toutes les repré- 
sentations de U dans un espace de Hilbert 
V se décomposent en représentations 
de dimension finie, le groupe U opérant 
pour ces représentations dans des SOUS- 
espaces de dimension finie de V, dont 
la somme est directe et partout dense. 
E. Cartan s’est le premier aperçu que 
les fonctions constituant les V, ont des 
propriétés remarquables. Pour 

U = SO(3, R), K = SO(2, R), par exem- 
ple, on obtient ainsi les fonctions sphéri- 
ques classiques définies sur U/K = S 2 
(sphère à 2 dimensions) comme restric- 
tions des polynômes harmoniques homo- 
gènes dans R\ 

On obtient d’autres fonctions spéciales, 
telles que les fonctions de Bessel ou les 
fonctions hypergéométriques, en prenant 
pour G certains groupes de dimension 4. 

Si on prend pour G un groupe semi- 
simple et pour F un sous-groupe discret 
convenable, on obtient cette fois comme 
fonctions « spéciales » ce qu’on appelle 
des fonctions (ou formes) automorphes , 
qui constituent une vaste généralisation 
des « fonctions fuchsiennes » de H. Poin- 
caré. 

Les fonctions appartenant à V ne sont 
pas nécessairement continues dans G, 
mais on peut montrer qu’il y a toujours 
un sous-espace dense V 0 de V, stable pour 
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la représentation de G et tel que, pour 
tout XE g (algèbre de Lie de G), la 
dérivée pour f r 0 de l’application 
t exp(/X) f existe pour tout f E V 0 . Si 
on note p(X) . f cette limite, p(X) devient 
un opérateur linéaire de l’algèbre de Lie g 
dans l’espace (de dimension infinie en 
général) V 0 . 

En physique quantique, V est un espace 
de « fonctions d’ondes », et G est soit le 
« groupe de Poincaré » (produit semi- 
direct du groupe de Lorentz SO(3, 1) et du 
groupe commutatif R 4 ), soit (dans la 
théorie récente des « particules élémentai- 
res ») le produit de ce groupe et d’un 
groupe compact tel que SU(2), SU(3) ou 
SU(6). Les opérateurs p(X) sont des 
opérateurs différentiels du premier ordre ; 
on peut étendre la représentation 
X ► p(X) de g à une représentation de 
l’algèbre enveloppante (6 (cf. chap. 5) ; 
pour k éléments Xj E g, 

p(Xi X 2 ... X k ) 

sera le produit d’opérateurs : 

p (X.mx,),,, P (X*); 

ce sont donc des opérateurs différentiels 
d’ordre quelconque. Un intérêt particulier 
s’attache aux opérateurs p(Z) (dits opéra - 
îeurs de Casimir) où Z appartient au centre 
de <§ ; comme ils commutent avec les p(X), 
ils agissent par homoîhétie dans chaque 
sous-espace V- de V où la restriction de la 
représentation considérée de G est irré- 
ductible ; en d’autres termes, les fonctions 
/E V- satisfont à des équations aux déri- 
vées partielles p(Z)/ = \f. Ainsi, pour 
G ~ SO(3, R), le centre de est engen- 
dré par l’unique élément 

Z = Xj + X? + Xj, où (X y ), j — 1, 2, 3 
est une base convenable de l’algèbre de Lie 
fo(3, R), et on constate que p(Z) est le 
laplacien , ce qui « explique » que l’on 


obtienne comme éléments des V, des 
polynômes harmoniques. En physique 
quantique, les valeurs propres A des opé- 
rateurs P(Z) dans chaque Vy sont mises en 
correspondance avec les valeurs des gran- 
deurs physiques fondamentales (tels que 
masse, spin, isospin, etc.) de la « particule 
élémentaire » associée à la représentation 
irréductible dans V- 

9. Généralisations 

On constate que les groupes semi- simples 
complexes sont des groupes linéaires algé- 
briques, c’est-à-dire des sous-groupes G de 
groupes linéaires GL(«, C), définis par des 
équations algébriques entre les éléments 
des matrices de G. On sait d’autre part que 
les groupes classiques peuvent être aussi 
définis pour un corps de base K quelcon- 
que au lieu du corps C (cf. la partie B 
ci-dessus - Groupes classiques et géomé- 
trie). On est donc conduit à se demander 
s’il n’existe pas une « théorie de Lie » pour 
les groupes linéaires sur un corps quelcon- 
que K et, comme ici il n’y a plus de notions 
topologiques, on les remplace par la res- 
triction que les groupes considérés sont 
algébriques au sens ci-dessus. 

On peut alors développer toute une 
théorie dont les résultats (mais non les 
méthodes) se calquent sur ceux de la 
théorie des groupes de Lie (Borel- 
Chevalley). On définit une notion (algébri- 
que) de « connexion » et des notions telles 
que celle de radical, de groupe semi- simple 
ou de sous-groupe de Borel d’un groupe 
algébrique exactement comme pour les 
groupes de Lie. Le résultat le plus remar- 
quable est que, lorsque le corps de base K 
est algébriquement clos (mais de caracté- 
ristique quelconque), les groupes semi- 
simples sont encore donnés par la claSSI- 
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fication de Killing-Cartan. Il n’y a plus ici 
de méthode « infinitésimale » à propre- 
ment parler, bien qu’on puisse encore 
définir une algèbre de Lie g (et même une 
algèbre associative #) associée à un groupe 
linéaire algébrique G ; mais son utilité est 
bien moindre que dans la théorie classique. 
Les raisonnements essentiels sont de 
nature globale et reposent sur le fait que, 
pour un sous-groupe de Borel B de G, le 
quotient G/B est encore muni d’une struc- 
ture de variété algébrique projective. En 
outre, on étend encore à ce cas la décom- 
position de Bruhat (cf. chap. 7), qui joue 
également un rôle important dans les 
démonstrations. 

Aux groupes linéaires algébriques défi- 
nis sur le corps des rationnels Q est 
maintenant rattachée la théorie des grou- 
pes arithmétiques : si G est un sous-groupe 
algébrique de GL(fl, Q), on dit qu’un 
sous-groupe T de G est arithmétique s’il 
laisse stable un réseau , c’est-à-dire un 
sous-Z-module de Q /J engendré par une 
base de Q n . Par exemple, SL(tf, Z) est un 
groupe arithmétique dans SL(«, Q). En 
considérant G et T comme sous-groupes 
du groupe de Lie G R (ensemble des 
matrices de GL(«, R) vérifiant les mêmes 
équations algébriques que celles qui défi- 
nissent G) et en utilisant à fond les 
techniques de la théorie des groupes semi- 
simples (notamment les décompositions de 
Bruhat et d’Iwasawa), on retrouve la 
théorie de la « réduction » des formes 
quadratiques à coefficients entiers de 
Hermite-Minkowski et le théorème de 
finitude de Jordan sur les classes de formes 
de degré )3 à coefficients entiers, et on 
les généralise considérablement. 

Au lieu de considérer G comme plongé 
dans G r , on peut aussi le considérer 
comme plongé dans Gq^, où est le 

corps des nombres p-adiques. Comme 


est ici muni d’une topologie, la correspon- 
dance entre algèbre de Lie et groupe de 
Lie est presque aussi satisfaisante en 
théorie p-adique que pour les groupes de 
Lie réels ou complexes. En utilisant à la 
fois les plongements de G dans G R et dans 
les Gq^ correspondant à tous les nombres 
premiers p , on arrive aux résultats les plus 
profonds de Minkowski-Siegel sur les 
formes quadratiques à coefficients entiers, 
ici encore largement généralisés et placés 
dans leur cadre naturel. Il est intéressant 
de noter que, dans cette théorie, un rôle 
particulièrement important est tenu par les 
mesures invariantes sur les groupes 
p-adiques. 

Enfin, la théorie des groupes semi- 
simples est liée de façon inattendue à celle 
des groupes finis. Si l’on part d’une base de 
Weyl-Chevalley (cf. chap. 6) d’une algèbre 
de Lie semi- simple complexe S, on constate 
que, pour chaque (X, l’application : 

1 1-* exp(r ad(X a )) 

est un isomorphisme du groupe additif C 
sur un groupe Xa de matrices qui, en vertu 
des relations ( 16 ), se trouvent avoir des 
éléments qui sont des polynômes en t à 
coefficients entiers. Cela permet de définir 
ces matrices lorsque t appartient à un corps 
(commutatif) arbitraire K. En prenant 
pour ü toutes les racines de 3, on obtient 
dans GL(fl, K) (où n = dim 3) un 
ensemble de matrices qui engendrent un 
sous-groupe G^ de GL(w, K), appelé 
groupe de Chevalley sur K associé à 3. En 
particulier si K est un corps fini, le groupe 
G k est un groupe fini. 

On prouve alors que, si l’on part d’une 
algèbre de Lie simple complexe s, le groupe 
de Chevalley correspondant G K est simple 
(au sens de la théorie des groupes « abs- 
traits ») sauf dans quatre cas correspon- 
dant à des corps à deux ou trois éléments 
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et à des algèbres de l’un des types A„ 
ou G 2 . Ces groupes simples, ont, en outre, 
des décompositions de Bruhat qui permet- 
tent d’étudier de façon détaillée leur struc- 
ture et qui (pour le cas d’un corps K fini) 
les distinguent nettement des autres types 
de groupes simples finis. 

JEAN DIEUDONNÉ 

Bibliographie 

H. Bacry, Leçons sur la théorie des groupes et les 
symétries des particules élémentaires, Dunod, Paris, 
1968 / A. Borel, Linear Algebraic Groups. repr. of 
1969, Springer-Verlag, New York, 2 e éd. 1991 ; 
Introduction aux groupes arithmétiques , Hermann, 
Paris, 1969 / N . Bourbaki, Groupes et algèbres de 
Lie, 5 vol., Masson, 1982 / J. Dieudonné. Spécial 
Functionsand Linear Représentations 0 f Lie Groups. 
American Mathematical Society, Providence (R.I.), 

1 982 / I. Celfand, Représentation Theory Selecled 
Papers , Cambridge Univ. Press, 1982 / G. Hochs- 
child, Basic Theory Of Algebraic Groups and Lie 
Algebras, Springer-Verlag, New York, 1981 / 
N. Jacobson, Lie Algebras , repr. of 1962, Dover 
Publ., 1979 /R. MNEIMÉ& F. ÏESTARD, Introduction 
à la théorie des groupes de L ie classiques , Hermann, 
1986 / V. S. Varadarajan, Lie Groups, Lie Algebras 
und their Représentations , Springer-Verlag, 1914, 
rééd. 1988 / N. Vilenkin, Spécial Functions and the 
T heory 0 f Group Représentations , repr. of 1983 ; 
American Mathematical Society , Providence (R.I.), 
1988 / B. G. Wybourne, Classical Groups for 
Physicists, repr. of 1974, Books on Demand, Ann 
Arbor (Midi.) / 0. L.Weaver & D. H. Sattinger, 
Lie Groups end Algebras with Applications to Physics, 
Geometry and Méchantes, Springer, 1986. 



HARMONIQUE analyse 


L orsqu’on fait vibrer, dans des condi- 
tions idéales, une corde de longueur /, 
fixée en ses extrémités d’abscisses 0 et /, 
l’équation aux dérivées partielles : 

d 2 u 2 d 2 u 
dt 2 C dx 2 

est vérifiée, où t/(x, t) est une fonction dont 
la valeur représente, à l’instant t y le dépla- 
cement transversal, par rapport à la posi- 
tion d’équilibre, du point d’abscisse A'. 

D’Alembert donne, en 1747, la solution 
de cette équation sous la forme : 

u{x,t) =f(ct +x)—f(ct — x), 

où f est une fonction quelconque de 
période 2 /. Quelques années plus tard, en 
1753, Daniel Bernoulli considère des solu- 
tions particulières de l’équation des cordes 
vibrantes, de la forme : 

«TT nir 

2 sin — x cos — et j 

ou encore : 

sin + a)] — sin[^(cr — x)]. 
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pour toute valeur entière positive de n. Ces 
solutions correspondent aux fonctionsfde 
la forme : 

f(x) = sm — x. 

Or les fonctions trigonométriques : 

. n 7T fl TT 

s 1 n - x ou COS y- X 

sont les plus simples des fonctions de 
période 2 L D’où l’idée, avancée par Ber- 
noulli, que la fonction f la plus générale, 
qui intervient dans la solution de d’Alem- 
bert, peut s’exprimer sous la forme d’une 
série trigonométrique : 

r, \ a 0 , , nn , . n™ v 

f(x) = — + > (a„cos— x +b n sm—x), 

n = I 

ou, de manière équivalente : 

OP 

n \ a o T" 1 «ir 
f(x) = — sin — (x — P„). 

n = 1 

Le terme correspondant à n = 1 donne 
alors la vibration fondamentale de la 
corde, les termes suivants correspondent 
aux harmoniques (cela rejoint l’expérience 
acoustique courante) ; de plus, le coeffi- 
cient a„ régit l’intensité de l’harmonique 
d’ordre n , et (3„ en définit la phase. 

Ainsi le problème des cordes vibrantes 
menait tout naturellement à la question 
suivante : une fonction périodique peut-elle 
se représenter par une série trigonométri- 
que ? L’analyse harmonique classique est, 
en principe, la branche des mathématiques 
qui traite de problèmes de ce type. 

Pour obtenir des éléments de réponse à 
cette question fondamentale, il a fallu, à 
partir du milieu du XVIII e siècle, que les 
mathématiciens se fassent une idée de plus 
en plus précise des objets sur lesquels ils 


travaillaient. C’est ainsi que l’étude de la 
représentation des fonctions périodiques 
par des séries trigonométriques devait 
fortement contribuer à la prise de cons- 
cience de la notion de fonction : la 
conception moderne d’une fonction, défi- 
nie comme une correspondance, et pou- 
vant fort bien ne posséder aucune des 
propriétés usuelles de régularité (conti- 
nuité, dérivabilité, intégrabilité), émergea 
peu à peu lorsqu’il devint évident que l’idée 
naïve d’une fonction donnée par une 
formule explicite était insuffisante : il fallut 
tout à la fois préciser ce qu’on entendait 
par « fonction quelconque » et considérer 
des classes particulières de fonctions dont 
les propriétés spéciales, soigneusement 
mises en évidence, permettaient de résou- 
dre un problème donné. 

Ensuite, la théorie des distributions et 
celle des groupes topologiques sont venues 
proposer diverses directions dans lesquel- 
les l’analyse harmonique se généralise et 
s’approfondit ; celle-ci est devenue une 
branche importante des mathématiques, en 
relation avec les distributions, les algèbres 
normées, les probabilités, les espaces de 
Hilbert, les fonctions de variable complexe 
et s’est étendue aux fonctions non linéaires. 

1. Les séries de Fourier 

Les coefficients de Fourier 

Considérons une fonction f à valeurs 
réelles ou complexes, d’une variable réelle, 
périodique, de période 2 tt pour fixer les 
idées. Si / admet un développement en 
série trigonométrique : 

( 1 ) f ( x ) = ? + ( a k cos kx + b k sin kx ) 

k ~ 1 
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et que la série Z ( ci k b k ) soit conver- 
gente, on peut intégrer terme à terme, 
entre 0 et 27T, les séries : 
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f(x) COS nx = ^COS nx 


K 

+ ^ (a k cos kx cos nx + b k sin kx cos nx ), 


k* 1 


f(x) sin nx = ~2 sin nx 


X 

(a k cos kx sin nx + b k sinkx sin nx ). 

^1 


Compte tenu des relations, valables 
pour des entiers n et k : 

Mtt f 0 sikfn, 

COS nx cos kx dx = \ tt si k — k 0, 

Jo [ 2 ît si k — n = 0 

f 2ir sin nx cos kx dx = 0, V k et n, 

JO 

f 2 ïï . , , f 0 si k n, 

sin nx sm fcc dx = < . , 

Jo [ TT SI & = 72, 

on obtient les valeurs des coefficients a, et 
b n directement à partir de la somme / (a) 
de la série donnée : 


( 2 ) 


= ij 2Tt /(x)cos nxdx, 
= - f ,?r f(x) sin nx dx ; 


ce sont les formules de Fourier. 

Si, maintenant, on part d’une fonc- 
tion f , de période 2ir, continue (il suffit, en 
fait, qu’elle soit intégrable, au sens de 
Lebesgue sur [0, 2 tt]), il est naturel de 
considérer, par analogie avec ce qui pré- 
cède, les coefficients a n et b,, donnés, pour 
un entier n ^ 0, par les formules (2). Ce 
sont les coefficients de Fourier de la fonc- 
tion /, et la série qu’ils définissent est la 
série de Fourier de f Rien ne permet de 
préjuger de la convergence de cette série 
vers f , aussi la relation entre f et sa série de 


Fourier n’est-elle pas notée par le signe 
d’égalité, mais on écrit : 


/(x) ~y + 


<K 

y* (a n cos nx -f- b n sin nx). 
n = 1 


Si, au lieu d’une fonction de période 2lT, 
on considère une fonction f de période T, 
on définit de manière analogue les coeffi- 
cients de Fourier de f par les formules : 



la série de Fourier de fest alors : 


a 0 


i 


2«tt , , . 2«tt 

a, cos + b n sin 


Questions de convergence 
Le problème de la représentation d’une 
fonction périodique par une série trigono- 
métrique se ramène à l’étude de la conver- 
gence de sa série de Fourier. Nous nous 
contenterons de donner ici quelques-uns 
des nombreux résultats obtenus dans ce 
domaine (cf. séries trigonomÉtriques) . 

a) D’abord, en dehors de toute notion 
de convergence, la série de Fourier d’une 
fonction caractérise celle-ci (cela doit être 
compris comme une caractérisation en 
tant que fonction mesurable au sens de 
Lebesgue, deux fonctions étant considé- 
rées comme équivalentes lorsque l’ensem- 
ble des points où elles diffèrent est négli- 
geable pour la mesure de Lebesgue : on dit 
alors qu’elles sont égales presque partout 
(cf. INTÉGRATION et MESURE) ; si l’on se 
restreint à la classe des fonctions conti- 
nues. l’égalité presque partout entraîne 
l’égalité partout). Autrement dit, si deux 
fonctions ont les mêmes séries de Fourier, 
elles sont égales presque partout. 


585 



HARMONIQUE ANALYSE 


b) Si les coefficients de Fourier, a n et b n , 
d’une fonction continue / forment une 
série absolument convergente (c’est-à-dire 
si la série Z ( a n | + b n \) converge), alors 
la série de Fourier de / converge unifor- 
mément vers une fonction continue qui, 
d’après ce qui précède, a même série de 
Fourier que / Le résultat ci-dessus montre 
donc quefest égale à la somme de sa série 
de Fourier. 

Certains critères permettent d’affirmer 
qu’une fonction continue f possède la 
propriété ci-dessus. Montrons que c’est le 
cas si, par exemple, la fonctionfadmet une 
dérivée seconde continue. Soit a, et b n les 
coefficients de Fourier de/, a n et b' n ceux 
de/ a”, et h”„ ceux def” (f r etf” sont 
respectivement les dérivées première et 
seconde def). Une intégration par parties 
dans les intégrales (2) écrites pour f' 
montre que l’on a : 

a' = nb n , b' n = -na„ 
et, par suite : 

a," = —n 2 a n , b" n - —n 2 b n . 

Or (2) entraîne que les coefficients de 
Fourier d’une fonction sont bornés en 
module (ils sont majorés par l’intégrale sur 
[0, 2 tt] du module de cette fonction, divisée 
par tt), de sorte que la suite n 2 ( a„ | + b n ) 
est bornée, ce qui montre que la série 
Z ( ü n + b n | ) converge. On obtient ainsi 
le résultat annoncé, qu’une fonction deux 
fois continûment dérivable est la somme de 
sa série de Fourier, la convergence étant 
d’ailleurs absolue et uniforme. 

c) Un résultat plus profond, dû à Diri- 
chlet et à Jordan, est le suivant, que nous 
donnons dans un cas particulier : Si la 
fonction / continue et périodique de 
période 2 TT, possède une dérivée continue, 
sa série de Fourier converge uniformé- 
ment vers / 


d) Si l’on fait simplement l’hypothèse 
quefest continue, on ne peut plus affirmer 
que la série de Fourier de f converge vers 
/ ce qui signifierait que la suite des 
fonctions : 

m 

S m {x ) — ^ ^ (a n cos nx + b „ sin nx ) 

n = L 

tend vers / lorsque m augmente indéfini- 
ment. Au lieu des sommes partielles S m de 
la série de Fourier de / considérons les 
fonctions : 

ff fa)= S l(*)+ S 2(*) + ... + S m (x) 

} m 

appelées moyennes de Césaro de la fonc- 
tion / On a alors le théorème de Fejer : Si 
/ est continue, ses moyennes de Césaro 
tendent uniformément vers / 

Coefficients de Fourier exponentiels 

Si l’on introduit la fonction exponentieile 
complexe e lx , liée aux fonctions trigono- 
métriques par les relations d’Euler : 

e u = cosx + i sïnx, 

e * + g-» 

cosx — 2 

e‘ x — e~ ix 

sin* =» 2/ 

on obtient l’égalité : 

a n cosnx+ b n sinnx= c n e mx -f c _ n e~ inx y 

où les coefficients a,„ b n , C, r c_ n vérifient les 
relations : 

a,-ib, 

c « - 2 

a, + ib, 

2 

a, = c„ + c_„, 
bn = i{c n ~c_ n y 

Si / est périodique et intégrable, on 
appellera coefficients de Fourier exponen- 
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tiels les nombres c,„ définis pour tout entier 
relatif n, par : 



et on appellera encore série de Fourier de 
/“(cf- séries trigOnomÉtriques) la série : 



n = 


Moyennant les relations ci-dessus entre 
les a,„ b n (n ^ 0) et c,, (n quelconque), il y 
a identité formelle entre cette notion de 
série de Fourier et la notion antérieure de 
série de Fourier trigonométrique (où l’on 
peut introduire un coefficient b 0 égal à 0). 

Nous utiliserons désormais la forme 
« exponentielle » de la série de Fourier 
d’une fonction f : 

+ « 

/(*)- ^ c»* 4 “> 

n — — <*> 

qui donne des calculs et des formules plus 
simples, et correspond mieux à la nature 
profonde de la situation mathématique, 
comme nous le verrons au chapitre 4. 

te théorème 

de Bessel-Parseval-Plancherel 

Soitfune fonction périodique continue, et 
soit : 

c n e mx , 

sa série de Fourier. On a alors l’égalité 
suivante : 

<*> èiw* 

n — °° 

Plus généralement, si on considère une 
fonction périodique, de carré intégrable 


sur [0, 2 tt], cette fonction est en particulier 
intégrable, et possède des coefficients de 
Fourier c„ tels que l’égalité (4) ait heu. 

Tout aussi remarquable est le fait que 
toute suite (c n ), n parcourant l’ensemble 
des entiers relatifs, telle que : 

Ë"- 1 ’ 

n ~ — x 

converge, est la suite des coefficients 
de Fourier d’une fonction de carré inté- 
grable. 

En d’autres termes, la correspon- 
dance entre une fonction de carré inté- 
grable sur [0, 2 tt] et la suite de ses 
coefficients de Fourier définit un isomor- 
phisme isométrique entre l’espace de 
Hilbert L’([0, 2 tt]) et l’espace de Hilbert P 
des suites de carré intégrable (les structu- 
res hilbertiennes des deux espaces 
ci-dessus sont définies par les produits 
scalaires : 

if\g ) = ^ J o 1 Vc*)ÿ(ô‘**> 

+ « 

la convergence de l’intégrale et de la série 
étant assurée par l’inégalité de Schwarz ; 
cf. intégration et mesure, espace de 
HILBERT) . 

Pour les fonctions périodiques de carré 
intégrable sur [0, 2 tt], les méthodes hilber- 
tiennes simplifient l’étude des séries de 
Fourier. Citons par exemple le résultat 
suivant, dont la démonstration est 
d’ailleurs facile : Si f est périodique, de 
carré intégrable sur [0, 27r]^ la série de 
Fourier : 



n — 
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defconverge vers/au sens de l’espace L 2 ; Pour toute fonction presque-périodi- 

cela signifie que : que l’expression : 


lim 

+ * 





Les fonctions presque-périodiques 
La somme de deux fonctions périodiques 
dont les périodes sont dans un rapport 
irrationnel n’est pas périodique (par exem- 
ple? e f - v -j-e _nr -v, sin x-f-cos \^2x sont des 
modèles de telles fonctions). Cependant, 
les fonctions de ce type ont des propriétés 
voisines de la périodicité. Cette idée a 
conduit Harald Bohr, vers 1925, à la 
notion de fonction presque-périodique. 

Une fonction /, continue sur la droite 
réelle, est appelée presque-périodique si, 
pour tout 6 > 0, il existe un nombre T > 0 
tel que tout intervalle de longueur T 
contienne au moins un nombre c tel que 
l’on ait : 


|/(X+C)-/(*)|<E 

pour toute valeur réelle de la variable x. 
Une fonction périodique possède évidem- 
ment cette propriété. De nombreuses défi- 
nitions équivalentes de la presque- 
périodicité peuvent être données ; en voici 
une : Une fonction est presque-périodique 
si, et seulement si, elle peut être approchée 
uniformément par une suite de fonctions 
de la forme : 


N 



n = 1 


où les c„ sont des nombres complexes et les 
X n des nombres réels. 

Les fonctions presque-périodiques for- 
ment un anneau, et toute limite uniforme 
d’une suite de fonctions presque- 
périodiques est une fonction presque- 
périodique. 


M-i f{x)dx 

possède une limite lorsque T tend vers 
l’infini. Cette limite, notée M(/), est appe- 
lée valeur moyenne de /. 

Par le biais des moyennes, on peut 
définir la série de Fourier d’une fonction 
presque-périodique. Pour tout \ réel, la 
fonction f (;t)e _,ÀY est presque-périodique ; 
appelons c ^ sa moyenne. On montre que 
les valeurs de A telles que cy ne soit pas nul 
forment un ensemble fini ou dénombrable 
A„ A„ . . . . A„ ; on appelle série de Fourier 
de / l’expression : 

X c ^ ; 

lorsquefest périodique de période 2 TT, les 
A, sont entiers et on retrouve la notion 
usuelle de série de Fourier. 

Les séries de Fourier des fonctions 
presque-périodiques jouissent de proprié- 
tés analogues à celles des séries de Fourier 
des fonctions périodiques. Citons par 
exemple le résultat suivant, analogue à la 
relation (4) : Pour toute fonction presque- 
périodique /, |/| 2 est presque-périodique et, 
si Yx n e^ nX est la série de Fourier de /, on 
a : 

M(i/i 2 )= y ic„p. 


2. Analyse et synthèse harmoni- 
ques 


Considérons une fonction f continue, de 
période 27 T, et soit : 



n = — w 
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sa série de Fourier. L’égalité : 

c n = J- [ lw 

2tt Jo 

entraîne : 

c„e‘“ = T j 2 ’ f(t)e‘ n( *—' ) dt 
_J o f (x -t)e«'dt 

Si nous appelons/ la translatée de /par t , 
définie par //y) =/ , (x— /), nous obte- 
nons : 

c n elnx = T - f 2ï /r(*)e“'*- 

2 TT Jo 

En considérant l’intégrale comme une 
limite de sommes finies, on peut dire, de 
manière peu précise mais imagée, que 
C n e mx (ou aussi bien e mx lorsque c n n’est pas 
nul) est limite de combinaisons linéaires de 
translatées de /. 

Cela nous conduit à la notion d’analyse 
harmonique et de spectre d’une fonction. 
Soit E un espace vectoriel topologique (cf. 
espaces vectoriels topologiques) de fonc- 
tions définies sur l’ensemble R des nom- 
bres réels, tel que si /G E et t (E R, la 
translatée f t appartienne à E, avec certai- 
nes conditions de continuité ; on suppose, 
de plus, que toute fonction exponentielle 
e ,kx , À réel, appartient à E. 

On dira qu’un nombre réel À appartient 
au spectre d’un élément f de E si la fonction 
e lKx peut être approchée, au sens de la 
topologie de E, par des combinaisons 
linéaires de translatées de/l On note o,(f), 
spectre defdans E, l’ensemble des tels X 
(pour une fonction donnée, la notion de 
spectre peut dépendre de la topologie dont 
est muni l’espace E). 

Le problème de l’analyse harmonique 
dans E d’une fonction f est la détermina- 
tion de CT t -(/ ). Le problème de la synthèse 
harmonique dans E de f est le suivant : f 
est-elle limite, dans E, de combinaisons 


linéaires d’exponentielles, e îh v , avec 
A £= a E (/) ? Si la réponse est positive, on 
dit quefsatisfait à la synthèse harmonique 
(ou encore que f est synthétisable) dans E. 

Prenons, par exemple, pour E l’espace 
des fonctions continues et bornées sur R, 
avec la topologie de la convergence uni- 
forme. Si f est une fonction périodique 
appartenant à E, le spectre de f est 
l’ensemble des entiers n tels que les coef- 
ficients de Fourier c correspondants 
soient non nuis ; le théorème de Fejer sur 
la convergence uniforme vers f des moyen- 
nes de Césaro montre que f est Synthéti- 
sable dans E. Plus généralement, si f est 
presque-périodique, de série de Fourier : 


avec c,, 7^ 0, le spectre defest l’ensemble 
des exposants A, qui figurent dans la série 
de Fourier de f. Pour une fonction conti- 
nue et bornée quelconque, le spectre est 
plus difficile à déterminer en général. Il est 
remarquable que, dans l’espace E que nous 
considérons ici, les fonctions synthétisa- 
bles soient exactement les fonctions 
presque-périodiques. 

En fait, les questions les plus intéressan- 
tes concernant la synthèse harmonique se 
posent lorsque l’on prend pour E l’espace 
L”(R), muni de sa topologie faible d’espace 
dual de L ] (R) (cf. intégration et mesure, 
et espaces vectoriels TOPOLOGIQUES). Ces 
problèmes, ainsi que leur généralisation au 
cas où l’on considère d’autres groupes que 
R (cf. chap. 4) sont loin d’être tous résolus 
et leur étude est l’un des points essentiels de 
l’analyse harmonique moderne. 

3. La transformation de Fourier 

Certaines classes importantes de fonctions 
ne se prêtent pas à l’analyse harmonique 
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telle qu’elle a été définie ci-dessus. Ainsi, 
l’espace L’(R) des (classes de) fonctions 
intégrables sur R ne contient aucune 
exponentielle ; aussi utilise-t-on un autre 
procédé pour en faire l’analyse et la 
synthèse. C’est la transformation de Fou- 
rier qui permet de définir le spectre d’une 
fonction intégrable et, dans certains cas, 
d’en faire la synthèse. 

Soit / une fonction intégrable (par 
exemple, continue et nulle hors d’un 
ensemble borné). A f on associe une autre 
fonction définie sur R, notée fou // et 
appelée transformée de Fourier de f .* 

(5) f(t) = (5/x 0 = 

La présence du coefficient 2 îT est 
conventionnelle (la convention n’est 
d’ailleurs pas universelle) et permet d’avoir 
une formule de réciprocité particulière- 
ment simple. 

Définissons, outre l’opérateur J de 
transformation de Fourier, l’opérateur 

de transformation de Fourier conjuguée 
(ou réciproque) : 

(6) (ÿ/xo = J B /t*>”*<fr- 

Pour toute fonction / et tout réel / on 
a : 

= CF/X— /). 

Propriétés 

de la transformation de Fourier 

a) Pour toute fonction intégrable/, //est 
continue et tend vers 0 à l’infini. Si on 
désigne par A(R) l’ensemble des fonctions 
F / pour /E L*(R), A(R) est donc un 
sous-espace de l’espace vectoriel C„(R) des 
fonctions continues sur R qui tendent vers 
0 à l’infini. En fait, A(R) est strictement 
plus petit que C,(R). 


b) Sifet g sont intégrables, leur produit de 
convolution /* g, défini par : 

(7) (f*g)(x) = JV(x — t)g(t)dt 

l’est également. On a alors la relation : 

F(f* 8) = (Ï/Wgf 

de sorte que A(R) est un anneau de 
fonctions continues sur R, de même que 
L‘(R) est un anneau pour la convolution. 
Cette circonstance permet d’appliquer à 
l’étude de A(R) et de L’(R) la théorie des 
algèbres normées (cf. algèbres normÉes) , 
qui en est d’ailleurs issue en grande partie. 

c) Si y et u sont des réels, cp une fonction, 
on définit les fonctions cp v , (p w , Cp, cp, cp par : 

<P y (x) = <v(x—y) 

cç u (x ) = e 2/ ™* cp(x ), 

ÏW = 

i(x) = gp( — -y) , 
cp(x) = <p(— x). 

On a alors : 

*(f y ) = 

*(f u ) = (Ff)u> 

F(f) = (£/), 

F(f) = (?f), 

n h = (*/)• 

d) Si / est dérivable et si f et /' sont 
intégrables, on a : 

(8) F(f'){t) = 2 in* (*/X0. 

e) Sifest intégrable, ainsi que son produit 
par x, alors 5/ est dérivable et on a : 

(9) ï(xf(x)) = - A (•?/)'. 

2/tf 

Il est intéressant de voir comment 
certaines propriétés des fonctions se tra- 
duisent sur leurs transformées de Fourier. 

Par exemple, les relations (8) et (9) 
montrent que plus une fonction est régu- 
lière (dérivable), plus sa transformée de 
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Fourier tend rapidement vers 0 à l’infini. 
Inversement, plus f tend rapidement vers 
0 à l’infini, plus .F/ est régulière. Voici un 
autre exemple, présenté en termes vagues : 
plus les valeurs d’une fonction sont 
concentrées autour de l’origine, plus celles 
de sa transformée de Fourier sont, au 
contraire, étalées. 

Le théorème de réciprocité 

De même que la série de Fourier d’une 
fonction périodique caractérise celle-ci, 
sans qu’aucune propriété de convergence 
soit nécessaire, la transformée de Fourier 
d’une fonctionfcaractérise cette fonction. 
Donc la donnée de frf contient toute 
l’information relative à f Dans certains 
cas, il est possible d’exprimer f explicite- 
ment à partir de frf 

Théorème. Si f et frf sont toutes deux 
intégrables, on a : 

(10) f = 

C’est là une remarquable propriété de 
symétrie entre les opérateurs fr et fr. 

On peut encore interpréter cela comme 
une propriété de synthèse : si on appelle 
spectre defle support de sa transformée 
de Fourier frf c’est-à-dire l’adhérence de 
l’ensemble des points où frf ne s’annule 
pas, le théorème de réciprocité, lorsque frf 
est intégrable, s’écrit : 

f{x) = ^f)(t)e^dt 

et exprime que f est, en un certain sens, 
synthétisable, puisque f (x) s’exprime sous 
la forme d’une intégrale (donc comme 
limite de combinaisons linéaires) à partir 
des exponentielles qui correspondent à des 
valeurs î contenues dans son spectre. 

Une classe très importante de fonctions 
se prête à l’utilisation du théorème de 
réciprocité : c’est la classe S des fonctions 


indéfiniment dérivables à décroissance 
rapide. Une fonction f appartient à S si, et 
seulement si, elle admet des dérivées de 
tous les ordres et si, quels que soient les 
entiers n et p : 


lira 

X — ±°° 


dxP 


= 0 . 


Les relations (8) et (9) montrent que si 
f appartient à S, il en est de même pour frf 
et réciproquement. De sorte que fr est un 
isomorphisme linéaire de S sur S. dont 
fr est l’isomorphisme réciproque. En fait, 
si on considère la topologie usuelle de S 

(cf. DISTRIBUTIONS ) , fr et fr sont des 

isomorphismes continus. 


Extension aux distributions tempérées 

Rappelons brièvement que, si l’on désigne 
par S’ l’espace des distributions tempérées, 
espace dual de S, la transformation de Fou- 
rier sur S permet de définir, par transposi- 
tion, la notion de transformation de Fourier 
sur S’ qui fournit un isomorphisme de S' sur 
S’. Cela donne d’intéressantes applications, 
par exemple, à l’étude d’équations différen- 
tielles. ou plus généralement d’équations de 
convolution (lorsque l’on étend cette théo- 
rie aux espaces R" de dimension supérieure 
à 1, on peut traiter par ce procédé des équa- 
tions aux dérivées partielles linéaires à coef- 
ficients constants). D’après la propriété h , 
une telle équation est transformée par Fou- 
rier en une équation qui pourra, dans cer- 
tains cas, se résoudre par division. Par 
exemple, un opérateur différentiel linéaire à 
coefficients constants (convolution par une 
combinaison linéaire de dérivées de la 
mesure de Dirac en 0) devient, par transfor- 
mation de Fourier, l’opérateur de multipli- 
cation par un polynôme. 

Ces idées sont à rapprocher de la 
transformation de Laplace (cf. calcul sym- 
bolique) . 
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Transformation 

de Fourier-Plancherel dans L 2 (R) 

Les espaces L’(R) et L’(R) ne sont pas 
inclus l’un dans l’autre. Mais ils contien- 
nent tous deux l’ensemble K(R) des fonc- 
tions continues milles hors d’un ensemble 
borné, et tout élément de L’(R) ou de 
L*(R) peut être approché, au sens de L 1 ou 
de L 2 selon le cas, par des éléments de 
K(R). 

Si /‘appartient à K(R), ^/appartient à 
L 2 (R), et on a l’égalité : 

( 11 ) f \f(x)\>dx= f 

Jr Jr 

formellement analogue à (4). 

Cette relation permet d’étendre à L’(R) 
la transformation de Fourier (aussi bien 
que la transformation de Fourier récipro- 
que) : on obtient ainsi un opérateur, 
toujours noté .T, de L 2 (R) dans L 2 (R) qui 
coïncide avec la notion précédente de 
transformation pour les fonctions qui, 
comme celles de K(R), appartiennent à la 
fois à L’(R) et à L 2 (R). 

Pour f dans L’(R), on écrit aussi 
parfois : 

(fr/XO = J f(x)e~ 2i * xt dx, 

bien que cette formule n’ait pas de sens 
pour deux raisons : d’abord, l’intégrale 
peut ne pas être convergente ; ensuite / / 
est un élément de L’(R), donc défini à un 
ensemble de mesure nulle près, et on ne 
peut pas considérer la valeur d’un tel objet 
en un point particulier. 

Ce nouvel opérateur de L 2 (R) dans 
L 2 (R), appelé transformation de Fourier- 
Plancherel, est un isomorphisme isométri- 
que de L 2 (R), dont l’isomorphisme réci- 
proque est 3 (plus exactement, l’extension 
de ~¥ à L 2 ). 


Pour f et g dans L 2 (R), on a l’identité 
de Parseval, qui exprime précisément l’iso- 
morphisme de l’espace de Hilbert L*(R) 
dans lui-même défini par : 

f h = f 

J K. Jr 

Cela permet, comme pour les séries 
trigonométriques, d’exploiter, dans l’ana- 
lyse harmonique des fonctions de carré 
intégrable, la puissance de la théorie des 
espaces de Hilbert. 

Généralisations 

La transformation de Fourier que nous 
avons introduite pour les fonctions d’une 
variable réelle se généralise sans peine aux 
fonctions de plusieurs variables réelles. 

Soitfune fonction intégrable sur R n (n 
entier 1). On définit la transformée de 

Fourier de f comme la fonction de n 
variables définie sur R" par : 

(*/X*l. *2. 

= J /(*l-*2* ••••*») 

X exp [— Ü'K{t { x { + + t n x n )\dx ! . .. dx n . 

Les propriétés sont, en dimension n , 
tout à fait analogues à celles que l’on a en 
dimension 1 , 

Une autre direction de généralisation 
consiste à définir la transformée de Fourier 
defnon seulement pour des valeurs réelles 
de f, mais aussi pour certaines valeurs 
complexes. On pose : 

U/XU = J 

fonction définie pour certaines valeurs de 
Z. Lorsquefest, par exemple, nulle pour les 
valeurs négatives de X, on retrouve la 
notion de transformée de Laplace (cf. 

CalCUl SYMBOLIQUE). 

Lorsque & f (z) peut être définie pour 
toute valeur de z, on peut déduire du 
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comportement de la fonction de variable 
complexe obtenue de nombreux renseigne- 
ments sur la fonction f’ donnée (théorème 
de Paley-Wiener, par exemple). 


4. Les groupes commutatifs 
localement compacts 

La mesure de Haar 

La démonstration par Haar, en 1933, de 
l’existence d’une mesure invariante par 
translation, sur une large classe de groupes 
topologiques, permet, à partir de cette 
époque, de situer l’analyse harmonique 
dans sa vraie perspective et d’en compren- 
dre la nature profonde. 

Si on considère, sur R, la mesure de 
Lebesgue dx, on constate qu’elle est inva- 
riante par translation, en ce sens que, pour 
toute fonction intégrable f et tout réel t, la 
translatée / est intégrable et a même 
intégrale que / De même, sur le groupe 
multiplicatif des nombres complexes de 
module 1, que l’on peut, en ce qui concerne 
la théorie de la mesure, identifier à l’inter- 
valle [0, 27r], la mesure de Lebesgue est 
invariante par translation, car, pour toute 
fonction intégrable / et tout A de module 1 , 
on a ; 

f 2 7 Q**)dt = \ U f(e*)dt. 

vo Jo 

Parmi les groupes topologiques, ceux 
qui sont localement compacts (cette classe 
contient, entre autres, les groupes de Lie) 
possèdent une propriété analogue. 

Pour une fonction f définie sur un 
groupe G, et un élément t du groupe, on 
considère les translatées / e t / de / par A 
respectivement à gauche et à droite, don- 
nées par : 


(le groupe est noté multiplicativement). Il 
y a lieu de distinguer les translations à 
gauche et à droite si G n’est pas commu- 
tatif. Lorsque G possède la propriété de 
compacité locale, le théorème de Haar 
affirme l’existence (et l’unicité à un facteur 
multiplicatif près) d’une mesure (cf. inté- 
gration et mesure) invariante par les 
translations à gauche, c’est-à-dire telle que, 
pour tout t G G et toute fonction intégra- 
ble / , f soit intégrable et de même 

intégrale que/ Il y a également une mesure 
invariante par les translations à droite, 
mais elle diffère en général de la mesure 
invariante à gauche (pour les groupes 
compacts, ces deux types de mesures sont 
identiques, de même que pour les groupes 
commutatifs). Une telle mesure est appelée 
mesure de Haar à gauche (ou à droite, 
selon le cas). Si |L1 est une mesure de Haar 
à gauche,/ une fonction ju-intégrable et t un 
élément de G, on a donc : 

Jt fdt> = J /du. 

Le théorème de Haar et l’étude des 
représentations linéaires des groupes topo- 
logiques forment le cadre de l’analyse 
harmonique abstraite. 

Nous allons donner un bref aperçu de 
cette théorie dans le cadre des groupes 
commutatifs localement compacts, où elle 
est beaucoup plus simple et plus dévelop- 
pée. 

Le théorème de dualité 

de Pontriaguine et Van Kampen 

Soit G un groupe commutatif localement 

compact ; l’opération de G est notée addi- 

tivement, 0 désigne l’élément neutre. 

On appelle caractère de G tout homo- 
morphisme continu de G dans le groupe 
multiplicatif des nombres complexes de 
module 1. Autrement dit, un caractère est 
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une fonction continue y sur G, telle que, 
quels que soient x et y dans G : 

|Y(*)|= 1, 

Y(* — y) = ^ = Y(x)TrO') ; 
on en déduit, évidemment : 

r(0) = 1, y(— *) = y(x), 

Y(* +y) = yWyO)- 

Si y et y’ sont deux caractères, la 
fonction qui, à tout x de G, associe 
y{x)Y(x) est encore un caractère que l’on 
note y + y’. 11 est facile de voir que l’on 
peut ainsi munir l’ensemble des caractères 
sur G d’une structure de groupe commu- 
tatif, que l’on rend localement compact en 
y considérant une topologie particulière 
(c’est la topologie de la convergence uni- 
forme sur les parties compactes de G). 

Notons G le groupe commutatif locale- 
ment compact formé des caractères de G. 
Ce groupe est appelé dual de G. On peut 
considérer le dual de G, qui est ungroupe 
commutatif localement compact G. 

Pour tout x de G, la fonction définie sur 
G par y — ► y(;e) est UI Î caractère sur G, 
donc un élément de G v On a ainsi une 
application de G dans G. 

Le résultat fondamental établi, vers 
1935, par Pontriaguine et Yan Kampen est 
le suivant : L’application de G dans G 
définie ci-dessus est un isomorphisme tOpO- 
logique. En d’autres termes, le dual du dual 
d’un groupe G s’identifie à G lui-même. 

Eu égard à la dualité, on notera indif- 
féremment : 

Y(*), *(y). <Y,*>, <*,Y> 

le nombre complexe égal à la valeur en 
Y G G du caractère y sur G, ou à la valeur 
en y G G du caractère x sur G. 

Soit par exemple, Z le groupe additif 
des entiers relatifs. Un caractère y sur Z est 


déterminé par la valeur y(l) = a, car 
y(n) = a” pour tout n G Z. Réciproque- 
ment, tout nombre a de module 1 définit 
un caractère y sur Z (tel que y( 1) = a), par 
la formule y(n) = a”. On identifie ainsi le 
dual de Z au groupe multiplicatif T des 
nombres complexes de module 1. D’après 
le théorème de dualité, les caractères sur T 
correspondent aux nombres entiers : tout 
caractère sur T est de forme a — ► oP pour 
un entier ri ; cela peut d’ailleurs se voir 
directement. Pour le groupe R des nom- 
bres réels, un caractère est une fonction 
continue cp telle que : 

|cp(x)|= 1, <j P(x—y) = cp(x)<pO); 

une telle fonction est nécessairement de la 
forme x — ► e 2mtx , où t est un paramètre 
réel ; à la somme t — f- t' correspond le 
produit des caractères définis par t et t' ; 
ainsi le groupe dual de R s’identifie à R 
lui-même. 

La transformation de Fourier 
Soit G un groupe commutatif localement 
compact, G le groupe dual de G, dx une 
mesure de Haar sur G. 

À toute fonction intégrablef sur G, on 
associe une fonction / sur G, la transfor- 
mée de Fourier de f définie, pour tout 
y G G, par : 

/(Y) = J* /(*) <Y.x > dx. 

Si G zz T, G = Z et la fonctionf est 
alors une suite, qui n’est autre que la suite 
des coefficients de Fourier de f (on peut 
considérer f indifféremment comme une 
fonction sur T, ou comme une fonction sur 
R de période 2 tt : on identifie les points de 
R congrus à t modulo 2 t T au nombre 
complexe Q lt de module 1) ; si G = R, 
G = R etf est la transformée de Fourier 
usuelle (sur R) de f Ainsi l’étude des séries 
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et intégrales de Fourier apparaît comme 
un cas particulier de la transformation de 
Fourier abstraite. 

La transformation de Fourier abstraite 
jouit de propriétés semblables à celles que 
nous avons vues dans le cas des fonctions 
de variable réelle. Citons-en quelques-unes. 

a) Si / est intégrable sur G, / est 
continue sur G. 

b) /= 0 si, et seulement si, f = 0. 
Autrement dit,/ caractérise parfaitement 
/ 

c) Soitfet g deux fonctions intégrables 
sur G. Alors la fonction f * g, définie sur G 
par : 

(f*g)(x) = £/(*— y)g(y)dy 

est intégrable, et : (f * g) = / g. 

Ainsi, l’ensemble A(G) des transformées 
de Fourier des fonctions intégrables sur G 
est une algèbre. Les méthodes générales de 
la théorie des algèbres normées s’appli- 
quent à l’étude de nombreuses propriétés 
de A(G), ou aussi bien de l’algèbre de 
convolution L’(G). 

d) Formule de réciprocité. On peut 
choisir les mesures de Haar dx et t/y de G 
et de G (qui dépendent d’un facteur 
constant que l’on peut ajuster) de telle 
sorte que, lorsque /est intégrdble sur G, 
et / intégrable sur G, l’on ait, pour tout 
X G G et tout y E G : 

/(T) = f /(*) < Y> *> dx > 

Jg 

f{x) - J* /(y) < 7 ,* > 

e ) Théorème d e Bessel-Parseval- 
Pluncherel : Sifest à la fois intégrable et 
de carré intégrable sur G,/ est de carré 
intégrable sur G et on a, avec le même 
choix des mesures de Haar que ci-dessus : 

f \f^)\ 2 dx = f |/(t)| 2 ^t. 

Jg Jg 


Cela permet, comme dans le cas réel, de 
définir une transformation de Fourier- 
Plancherel qui est un isomorphisme iso- 
métrique de L’(G) sur L 2 (G). Ici encore, 
les méthodes propres aux espaces de Hil- 
bert s’appliquent avec fruit. 

Ainsi, l’étude des groupes commutatifs 
localement compacts offre à l’analyse har- 
monique son cadre naturel, et l’étude 
abstraite permet de retrouver et d’appro- 
fondir la théorie de l’analyse harmonique 
sur R et celle des séries de Fourier. Bien 
entendu, des propriétés liées à la structure 
particulière de R (comme celles qui se 
rattachent à la dérivation, l’extension aux 
distributions, par exemple) ne sont pas 
susceptibles d’un tel traitement abstrait. 
Aussi l’analyse harmonique continue-t-elle 
à se développer sur les deux plans, dans le 
cadre abstrait des groupes commutatifs 
localement compacts, et dans le cadre 
classique de la droite réelle et des espaces 

R' 2 . 

Notons enfin que, si l’on considère des 
groupes localement compacts non com- 
mutatifs, il existe - surtout dans le cadre 
des groupes de Lie une théorie similaire, 
mais beaucoup plus éloignée de la situation 
« classique » de l’analyse harmonique sur 
R (par exemple l’objet dual n’est plus un 
groupe, la transformée de Fourier d’une 
fonction n’est plus une fonction numéri- 
que, etc.), et qui fait actuellement l’objet 
d’un développement rapide. 

RENÉ SPECTOR 
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L a théorie des espaces hilbertiens trouve 
son origine dans celle des développe- 
ments de fonctions arbitraires en séries de 
fonctions orthogonales, lesquelles appa- 
raissent le plus souvent comme fonctions 
propres de certains opérateurs différentiels 
linéaires (séries de Fourier, fonctions sphé- 
riques, théorie des oscillations de Sturm- 
Liouville). À l’occasion de l’étude des 
équations intégrales, ébauchées par V. Vol- 
terra, I. Fredholm et E. Schmidt, Hilbert 
définit l’espace / 2 des suites de carré 
sommable, et résout les principaux problè- 
mes posés en interprétant les équations en 
termes d’endomorphismes de l’espace l 2 . 
E. Schmidt. M. Fréchet et F. Riesz don- 
nent ensuite une forme plus géométrique à 
la théorie de Hilbert, en introduisant le 
langage des normes, de l’orthogonalité et 
des bases hilbertiennes, et découvrent que 
de nombreux espaces fonctionnels classi- 
ques sont isomorphes à / 2 , ou à des 


sous-espaces vectoriels de cet espace. Dès 
lors s’impose une présentation axiomati- 
que des espaces préhilbertiens et hilber- 
tiens ; elle est essentiellement due à J. von 
Neumann et à F. Riesz ; le lecteur la 
trouvera esquissée ci-dessous. Enfin, ces 
derniers approfondissent considérable- 
ment l’étude des endomorphismes des 
espaces hilbertiens, et créent ainsi un des 
outils les plus puissants de l’analyse fonc- 
tionnelle et de la physique mathéma- 
tique. 

Nous supposons connus les notions 
fondamentales de l’algèbre linéaire (cf. 
algèbre linéaire et MULTILINÉAIRE), le 
langage des normes et semi-normes, et la 
notion de famille sommable (cf. séries et 
PRODUITS INFINIS). 

Généralités 

Espaces préhilbertiens 

On appelle espace vectoriel préhilbertien 
(complexe) un espace vectoriel SUT le 
corps C des nombres complexes, muni 
d’une forme sesquilinéaire autoadjointe 
dont la forme hermitienne associée est 
positive, c’est-à-dire d’une application de 
EXE dans C, notée (a, y) | — ► (x y), satis- 
faisant aux conditions suivantes : 

- pour tout élément y de E, l’application 
X •”*’ (.Y }’) est linéaire ; 

- pour tout couple (x, }’) d’éléments de E, 

(y O = (x y) ; 

pour tout élément x de E, (xj x) ^ 0. 

Le scalaire (x y) s’appelle produit her- 
mitien des vecteurs x et y. 

On dit que l’espace vectoriel E est 
préhilbertien séparé, ou hermitien, si la 
forme hermitienne considérée est définie 
positive, c’est-à-dire si la relation 
(x x) = 0 implique la relation x = 0. 
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Théorème 1. Pour tout couple (x, y) 
d’éléments d’un espace préhilbertien E : 

(inégalité de Schwarz). 

Écartons le cas où l’un des deux vec- 
teurs x et y est nul. Écrivons que, pour tout 
nombre réel $ et pour tout nombre com- 
plexe P de module 1, le nombre réel : 

(x + a$y \x + cx|3 y) 

= agap (y \ y) + a(3(x | y) 

+ aP (y \x) + (x |x) > 0, 

ou encore : 

a 2 (y | y)+ 2aRe[j3(x \y)] + (x \ x) ^ Q ; 

par suite, le discriminant de ce trinôme du 
second degré en a est négatif ou nul pour 
tout nombre complexe (3 de module 1, 

(Re[P(x J *)]) 2 < (x\x).(y\y). 

L’inégalité cherchée étant évidente lors- 
que (x| y) = 0, écartons ce cas. Nous 
obtenons alors l’inégalité de Schwarz en 
posant : 


Lorsque l’espace vectoriel E est hermi- 
tien, on montre qu’il y a égalité dans 
l’inégalité de Schwarz si et seulement si les 
vecteurs x et y sont colinéaires. 

Théorème 2. Soit E un espace vectoriel 
préhilbertien. L’application qui à tout 
vecteur x de E associe le nombre réel 
positif || x |] = (x| x)'/ 2 est une semi-norme 
sur E, dite associée à la forme sesquili- 
néaire (x, y) ^ (xT] y). 

En effet, pout tout nombre complexe a, 

| (XX 1 = a . | X ||. Pour tout couple (x, y) 
de vecteurs de E : 

( 1 ) \\x + y\\ 2 = (x y \ x +y) 

-- ll*|| 2 + \\y II 2 + 2 R e(x\y). 


D’autre part : 

(2) (!l*|| + b\\y. Ul z + lj'l 2 + 2 \\x\\.\\y II. 

L’inégalité triangulaire : 

II* +y ii a II* h + Il y II 

découle des relations (1) et (2), de la 
relation Re(x y) (x y) et de l’inéga- 
lité de Schwarz. 

La semi-norme précédente est une 
norme si et seulement si l’espace vectoriel E 
est hermitien. Le nombre réel positif |x|| 
s’appelle alors norme hermitienne du vec- 
teur x, et le nombre || x -y J distance hermi- 
tienne des points x et y. Un vecteur de 
norme 1 est dit unitaire. Dans ces condi- 
tions, il y a égalité dans l’inégalité triangu- 
laire si et seulement si les vecteurs x et y sont 
colinéaires et de même sens, c’est-à-dire s’il 
existe un couple (a, P) de nombre réels posi- 
tifs non tous deux nuis tel que ax = P> ? . 

Espaces hilbertiens 

En algèbre, on utilise surtout les espaces 
hermitiens de dimension finie. En analyse, 
ce sont les espaces hermitiens de dimen- 
sion infinie qui interviennent dans la plu- 
part des questions ; on est amené à sup- 
poser que ces espaces sont complets, 
c’est-à-dire que toute suite de Cauchy est 
convergente. Un espace hermitien complet 
est dit hilbertien. Tout espace hermitien de 
dimension finie est hilbertien. 

Voici deux exemples fondamentaux : 

Soit I un ensemble non vide. L’espace 
vectoriel O 1 ^ des applications de I dans C 
nulles sauf pour un nombre fini de valeurs 
de la variable, muni de la forme ses- 
quilinéaire qui, aux vecteurs X = (£/) et 
y = (n,), i e i, associe le nombre com- 
plexe : 
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est hermitien ; il est hilbertien si et seule- 
ment si l’ensemble 1 est fini. 

Soit I?(I) l’espace vectoriel des familles 
.Y ~ (£,), i E 1, de nombres complexes 
telles que : 

2j£,-l 2 < +“• 

i€ I 

Si x = (q,) et y = (q ; ), i E 1, sont deux 
éléments de cet espace, la famille (£,r),), 
i E I, est sommable. Muni de l’application : 

(x,y ) ■— ^ Ç,ih, 

/ei 

/ - (I) est un espace hilbertien. 

Voici deux autres exemples, dont 
l’importance est capitale en analyse fonc- 
tionnelle. Soit I un intervalle de R non 
réduit à un point, et p une fonction à 
valeurs réelles continue sur I, prenant des 
valeurs strictement positives en tout point 
intérieur a I. Soit C(I, p) l’espace vectoriel 
des fonctions f continues sur I à valeurs 
complexes telles que : 

| [ l/(0l 2 /’(0* < +°°. 

Pour tout couple (/, g) d’éléments de cet 
espace vectoriel, fgp est intégrable sur I. 
Muni de l’application : 

(3) (/',?) — jV('M)/’ (?)dt, 

CU P) est un espace vectoriel hermitien, 
mais ce n’est pas un espace hilbertien. En 
revanche, l’espace vectoriel L 2 (I, p) des 
classes de fonctionsfà valeurs complexes, 
mesurables sur I et telles que : 

J i l/(0l 2 />(0<* < +°°. 

muni de l’application définie par la for- 
mule (3), est hilbertien, ce qui met en 


évidence l’intérêt de la théorie de Lebesgue 
pour toutes ces questions. 

Orthogonalité 

On dit que deux vecteurs X et y d’un espace 
hermitien E sont orthogonaux si leur 
produit hermitien est nul : (x J J') = 0. 
Puisque (y x) — (x y), cette relation est 
symétrique. 

On dit que deux parties A et B de E sont 
orthogonales si, pour tout élément x de A 
et pour tout élément y de B, (xl y) = 0. 
L’ensemble, noté A 1 , des vecteurs ortho- 
gonaux à une partie A de E est un 
sous-espace vectoriel fermé de E, appelé 
orthogonal de A. L’orthogonal de E est 
réduit au vecteur nul. 

Soit F un sous-espace vectoriel de E. On 
dit que F admet un supplémentdire ortho- 
gonal s’il existe un sous-espace vectoriel G 
de E orthogonal à F tel que E = F ©G. 
Alors G = F 1 ; c’est pourquoi F 1 s’appelle 
le supplémentaire orthogonal de F dans E. 
La projection d’un vecteur X de E sur F 
parallèlement à G s’appelle projection 
orthogonale de x sur F. Sous ces mêmes 
hypothèses, (F 1 ) 1 = F. En effet, il est 
évident que (F 1 ) 1 contient F. Soit donc X 
un élément de (F 1 ) 1 ; écrivons x sous la 
forme x = y + z , où y E F x et z E F. Il 
s’ensuit que : 

(x b) = (y |j0 + IjO. 

c’est-à-dire que (y\ y) = 0. Ainsi, y = 0, et 
X = Z, Le vecteur x appartient donc à F. 

Soit maintenant (F,-), i E 1, une famille 
de sous-espaces vectoriels de E orthogo- 
naux deux à deux, et F leur somme. Alors 
cette somme est directe ; c’est pourquoi 
l’on dit que F est somme directe orthogo- 
nale des sous-espaces vectoriels F,. 

Soit S == (x,), i E I, une famille de 
vecteurs d’un espace hermitien E. On dit 
que S est orthogonale si, pour tout couple 
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(ij) d’éléments distincts de I, les vecteurs 
Xj et .Y, sont orthogonaux. Dans ces condi- 
tions, pour toute partie finie J de I : 

i£*,.«> = 2>i 2 

/€ J /ej 

(théorème de Pythagore). On dit que S est 
orthonormale si, de plus, pour tout élé- 
ment i de 1, le vecteur x i est unitaire ; la 
somme des droites Cx, est alors directe 
orthogonale. 

On dit enfin que S est une base hilber- 
tienne de E si S est orthonormale, et si le 
sous-espace vectoriel engendré par S est 
dense dans E. Cette notion est mieux 
adaptée à l’analyse que celle de base 
orthonormale. 

Par exemple, la base canonique (e,), 
/G 1, de l’espace vectoriel C (1) est ortho- 
normale ; cette famille est une base hilber- 
tienne, dite canonique, de l’espace hilber- 
tien / 2 (I), car C (I) est dense dans / 2 (I). 

Voici un autre exemple, lié de manière 
essentielle à la théorie des séries de Fou- 
rier. Soit C(T) l’espace vectoriel des fonc- 
tions continues sur R à valeurs complexes 
et admettant 1 pour période, muni du 
produit hermitien : 

La famille (e n ), n G Z, des fonctions 
définies par les formules : 

e,(f) = e 2imt 

est une base hilbertienne de C(T) ; les 
éléments du sous-espace vectoriel engen- 
dré par S s’appellent polynômes trigono- 
métriques. L’espace hermitien C(T) n’est 
pas complet; il peut s’identifier à un 
sous-espace vectoriel de l’espace vectoriel 
hilbertien L’([0, i]), dense dans L’([0, 1]). 
La famille (e„), n G Z, apparaît alors 
comme une base hilbertienne de L 2 ([0, 1]). 


Théorie élémentaire 

L’étude des espaces hermitiens de 
dimension finie repose sur le théorème qui 
suit. 

Théorème 3. Tout espace hermitien de 
dimension finie admet au moins une base 
orthonormale. 

La démonstration s’effectue par récur- 
rence sur la dimension de l’espace hermi- 
tien E. Soit donc E un espace hermitien de 
dimension strictement positive n . Choisis- 
sons un vecteur unitaire e^. L’ensemble H 
des vecteurs orthogonaux à est un 
hyperplan de E, car c’est le noyau de la 
forme linéaire non nulle (x ?()■ De 

plus, £| n’appartient pas à H, si bien que 
E est somme directe orthogonale de la 
droite Ce, et de H. Il suffit alors d’appli- 
quer l’hypothèse de récurrence à H, qui est 
de dimension n — 1, pour obtenir une base 
orthonormale de E. 

Théorème 4. Soit E un espace hermitien 
et F un sous-espace vectoriel de E de 
dimension finie. 

- Pour tout vecteur X de E, il existe un 
couple (y, z) et un seul de vecteur de E tel 
que y G F 1 , z G F et x = y -f- z. Autre- 
ment dit, le sous-espace vectoriel F 1 est 
supplémentaire orthogonal de F dans E. 
Par suite, (F 1 ) 1 = F. Enfin, pour tout 
vecteur u de F différent de z, 

II* - «Il > II*- 4 

~ Si F est muni d’une base orthonormale 
(e b e h .... e„), alors : 



Munissons F d’une base orthonormale 
(Vj, e C p ). Le vecteur z, s’il existe, peut 
s’écrire d’une manière et d’une seule sous 
la forme z = d x e x -| b (X p e p ; or. 

(x | 6j) = (y \ e t ) + (z | ej) = a ; ; 
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par suite, les vecteurs y et Z sont nécessai- 
rement définis par les formules : 

,, 

ce qui prouve l’unicité du couple (y, z). 
Réciproquement, les vecteurs ainsi définis 
conviennent visiblement. 

Soit maintenant u un vecteur de F. Le 
vecteur x — Z est orthogonal à F, et le 
vecteur z — U appartient à F. Donc : 

\\x — U II 2 = II* — z I ] 2 + \z — U II 2 , 

ce qui achève la démonstration. 

Corollaire 1. Toute famille orthonor- 
male d’éléments d’un espace hermitien E 
de dimension finie peut être complétée en 
une base orthonormale de E. 

Soit en effet F le sous-espace vectoriel 
engendré par une famille orthonormale L. 
D’après le théorème, F 1 est supplé- 
mentaire orthogonal de F dans E. Il existe 
une base orthonormale L’ de F 1 . La base 
de E obtenue en réunissant L et L’ 
convient. 

Corollaire 2. Soit (cq, e 2 , . . . . e p ) une 
famille orthonormale de vecteurs d’un 
espace hermitien E, et x un vecteur de E. 
Pour tout élément j de [ 1 , w], on pose 
^1 — (x Cj). Alors la fonction / qui à tout 
élément (A„ A„ . . . . A„) de QP associe le 
nombre réel positif : 

p 

/V i,x 2 *,) = IU-2>I 

}= 1 

admet un minimum strict au point (£j, £ 2 » 

. ... t, p ). Autrement dit, pour approcher le 
mieux possible (en norme) un vecteur x par 
des éléments de la forme : 



il convient de prendre \j = pour tout 
y £ [ 1 , /?]. Posons en effet : 



;= 1 ;=» 


Puisque U appartient au sous-espace 
vectoriel F engendré par e h . . . . e p , nous 
savons que, si u 7^ Z : 

lx-ul>lx-z% 

ce qu’il fallait prouver. 

Soit, par exemple, /une fonction conti- 
nue à valeurs complexes admettant 1 pour 
période, et p un entier naturel. Parmi 
les polynômes trigonométriques de la 
forme : 



n=—p 


celui qui approche le mieuxfen moyenne 
quadratique est le polynôme : 

s,=£(/ e n )e„, 

*=~P 

somme partielle à l’ordre p de la série de 
Fourier de f 

Procédé d 'orthonormalisation de 
Schmidt. Soit E un espace hermitien, (cq, 
e p ) une famille orthonormale de 
vecteurs de E, et F le sous-espace vectoriel 
de E engendré par cette famille. On 
suppose que F est différent de E, et on 
considère un vecteur .y de E n’appartenant 
pas à F. Il existe alors un vecteur e p +\ de 
E et un seul tel que : 

- la famille (e h e 2 , e p , e p +\) soit ortho- 
normale ; 

le vecteur e p+{ appartienne au sous- 

espace vectoriel F © Cx ; 

le scalaire (e p + j .x) soit réel positif. 
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De plus, le vecteur e p +\ est donné par 
la formule : 


&p + 1 


= b ir 


ou : 


y 



(x ej)ej 


Par récurrence, on en déduit le théo- 
rème suivant. 

Théorème 5. Soit (x rt ), n E N, une 
famille libre d’éléments d’un espace her- 
mitien E. Il existe alors une famille ortho- 
normale (r„), n E N, et une seule de 
vecteurs de E telle que, pour tout entier n , 
e n appartienne au sous-espace vectoriel 
engendré par les vecteurs Xq, Xj, . . . . x n , et 
que (xJ e„) soit réel positif. On dit que (e„), 
n EN, se déduit de (x n ), u E N, par 
orthonormalisation. Ces deux familles 
engendrent le même sous-espace vectoriel 
F de E. 

En particulier, si (x„), «EN, est totale, 
c’est-à-dire si F est dense dans E, (e,,), 
tî E N, est une base hilbertienne de E. Il en 
résulte que tout espace hermitien séparable 
(c’est-à-dire, admettant une famille de vec- 
teurs totale dénombrable) admet une base 
hilbertienne dénombrable. 

Appliquons ces résultats à l’espace her- 
mitien C(I, p) introduit plus haut, en 
supposant que, pour tout entier naturel n, 
la fonction x„ : t >— »• f est un élément de 
C(I, p). La famille (e,), déduite de (x„), 
«EN, par orthonormalisation est consti- 
tuée de fonctions polynomiales, e„ étant de 
degré il. La famille (e„) s’appelle système 
de polynômes orthogonaux associé au 
poids p sur l’intervalle I. Lorsque l’inter- 
valle I est borné, (e„), «EN, est une 
base hilbertienne de C(I, p) ; il en est de 
même lorsque I est non borné, s’il existe 


deux nombres réels strictement positifs 
a et P tels que, pour tout / G I, /?(/ ) ^ 

P exp (—a î ) (cf. polynômes ORTHOGO- 
NAUX). 

Étudions enfin les principales proprié- 
tés des bases hilbertiennes. 

Théorème 6. Soit (£•), /EL une famille 
orthonormale d’éléments d’un espace her- 
mitien E, F l’adhérence du sous-espace 
vectoriel engendré par les vecteurs e„ x un 
vecteur de E, et (Ç f -), / E I, la famille des 
composantes de x suivant (e,), i E I, c’est- 
à-dire des scalaires = (x e,). 

1. La famille (£,), i E I, est de carré 
sommable, et : 

^|Ï,| 2 <IMI 2 

/€ I 

(inégalité de Bessel). 

2. Pour que x appartienne à F, il faut 
et il suffit que : 

^|Ï /| 2 = II* II 2 

i E I 

(égalité de Parseval). 

Dans ces conditions, la famille (t^), 
i E I, est sommable, et : 

* = X i,e> ' 

ie i 

3. Pour tout couple (x, y) d’éléments 
de F de composantes respectives (£,) et 
(îp), i E I, la famille (t,q,), i E I, est som- 
mable, et : 


c*b) = 


Z £ ' n " 

/El 


Ce théorème est une conséquence immé- 
diate du théorème 4, puisque, pour toute 
partie finie J de I, la projection orthogonale 
dessurle sous-espace vectoriel F, engendré 
par la famille (e,), i E T est égale à : 


z 


/EJ 
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Lorsque (é>.), / £ I, est une base hilber- 
tienne de E, les assertions 2 et 3 s’appli- 
quent à tous les éléments de E. 

Corollaire. Soit E un espace hermitien et 
(e-), i G I, une base hilbertienne de E. Alors 
l’application qui à tout vecteur de E 
associe la famille de ses composantes dans 
la base (e,) est un isomorphisme de l’espace 
hermitien E sur un sous-espace vectoriel de 
l’espace hilbertien / 2 (I). 

Si l’espace E est hilbertien, cette appli- 
cation est un isomorphisme de E sur / 2 (I). 

En effet, si E est complet, pour tout 
élément (a,), i G I, de 1 2 (I), la famille (Cfyé,), 
i G I, est sommable. Alors le vecteur : 



ie i 


admet a, pour i-ième composante. 

On peut appliquer ce théorème aux 
développements en série de fonctions 
orthogonales (séries de Fourier, polynô- 
mes orthogonaux, etc.). 

Espaces hilbertiens 

Dans la théorie précédente, le théorème de 
projection orthogonale (théorème 4) a 
joué un rôle fondamental, Il ne s’étend 
malheureusement pas au cas d’un sous- 
espace vectoriel fermé quelconque F d’un 
espace hermitien. Ainsi, dans l’espace 
hermitien C([— 1, 1]), l’hyperplan fermé 
noyau de la forme linéaire continue : 

/- J o 7(o* 

n’admet pas de supplémentaire orthogo- 
nal, Néanmoins, si F est complet, le 
théorème 4 s’étend de la manière suivante : 

Théorème 7. Soit E un espace hermitien 
et F un sous-espace vectoriel complet de E. 
Alors F admet un supplémentaire ortho- 
gonal, et (F 1 ) 1 = F. 


Ce théorème contient le théorème 4 
comme cas particulier, et s’applique aussi 
au cas où E est hilbertien et F fermé. 

La démonstration s’appuie sur le théo- 
rème suivant. 

Théorème 8. Soit E un espace hermi- 
tien, F une partie convexe complète non 
vide de E, et x un élément de E. Il existe 
alors un élément z de F et un seul tel que : 

I* -z iU d(x, F), 

0 ù : 

d(x, F) = inf ||* — u | . 

«GF 

On montre pour cela que toute suite {z n ) 
de points de F telle que || X — z n || converge 
vers d(x, F) est une suite de Cauchy. 
Comme F est complet, la suite (z„) admet 
une limite z dans F, et on vérifie que Z 
convient. 

On en déduit facilement le théorème 7. 
en prouvant que y — x — Z est orthogonal 
à F. 

Dégageons quelques conséquences du 
théorème 7. 

Corollaire 1. Soit F un sous-espace 
vectoriel fermé d’un espace hilbertien E. Si 
F ^ E, il existe un vecteur non nul de E 
orthogonal à F. 

Corollaire 2. Pour qu’une famille (?/), 

1 G I, de vecteurs d’un espace hilbertien E 
soit totale, il faut et il suffit que le vecteur 
nul soit le seul vecteur orthogonal à tous les 
vecteurs e,. 

Corollaire 3. Soit a un vecteur d’un 
espace hilbertien E. L’application f t : 
X * (x ü) est une forme linéaire dont la 
norme est égale à celle de a. Autrement dit : 

sup (* a) = \\a ||. 

il* k 1 

Réciproquement, pour toute forme 
linéaire continue f sur E, il existe un 
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vecteur a de E et un seul tel quefsoit égale 
à l’application X l— * (x| a). Ainsi, l’applica- 
tion a h ~"'f a est une application semi- 
linéaire bijective de E sur son dual topo- 
logique E*. 

Corollaire 4. Toute famille orthonor- 
male d’éléments d’un espace hilbertien E 
peut être complétée en une base hilber- 
tienne de E. En particulier, tout espace 
hilbertien admet au moins une base hil- 
bertienne (e ; ), i G 1. L’application 

(<*/) ^ ^ a i e i 
/€ I 

est alors un isomorphisme de l’espace 
hilbertien ^(I) sur E. 

On démontre aussi que deux bases 
hilbertiennes d’un espace hilbertien E sont 
équipotentes. Le cardinal d’une base hil- 
bertienne de E s’appelle dimension hilber- 
tienne de E. 

LUCIEN CHAMBADAL et JEAN-LOUIS OVAERT 
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L es premières équations intégrales 
furent obtenues par Daniel Bernoulli 
vers 1730 dans l’étude des oscillations 
d’une corde tendue. Après l’introduction 
du noyau de Green, il fallut attendre les 
dernières années du XIX e siècle, avec les 
travaux de H. A. Schwarz, de H. Poincaré, 
de V. Volterra et surtout ceux de 1 . Fred- 
holm, pour disposer de résultats généraux 
en liaison étroite avec les premiers déve- 
loppements de l’analyse fonctionnelle. 
Quelques années plus tard, l’étude des 
équations intégrales conduisait D. Hilbert 
à définir l’espace qui porte son nom et à 
poser les premières bases de la théorie 
spectrale, cadre dans lequel F. Riesz déve- 
loppa la théorie des opérateurs compacts 
(19 18). Ainsi, les équations intégrales ont 
joué un rôle historique important dans 
l’élaboration des principaux concepts de 
l’analyse contemporaine. 


E. U. 
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1 . Exemples 

La forme usuelle d’une équation intégrale 
est : 

(1) - A J A K(x,Ç).y(Ç) </£=/(*), 

où A est une partie de R m décrite par 
chacune des variables x et £, K une 
fonction donnée sur A 2 appelée noyau de 
l’équation, f une fonction donnée sur A, 
qui est la constante 0 dans l’équation 
homogène \ 

(2) y(x)= A ^K(x,i)y(t)dC, 

enfin la fonction y est l’inconnue de 
l’équation et A un paramètre ; toutes ces 
quantités sont de préférence complexes. 

Problème de Sturm-Liouville 
Le problème de Sturm-Liouville (cf. équa- 
tions différentielles, chap. 3) concerne 
les valeurs du paramètre réel A pour 
lesquelles l’équation différentielle linéaire 
homogène : 

L y — \ry = 0 


(où L est un opérateur différentiel d’ordre 
n à coefficients continus sur un intervalle 
compact [a. b] de R et r une fonction 
continue strictement positive sur cet inter- 
valle) a des solutions non milles vérifiant n 
conditions aux limites données. 

Si 0 n’est pas l’une de ces valeurs de A, 
on définit une fonction de Green G du 
problème, continue sur [a, b] 2 ; si l’on 
connaît G, la formule intégrale : 

y(x) = jy(x,i)f{i)di 


donne la solution de l’équation non homo- 
gène : 

L V =/(*), 

vérifiant les conditions aux limites don- 
nées, de sorte que le problème de Sturm- 
Liouville est transformé en l’équation inté- 
grale homogène : 

y(x)= a£g (x,Ç)r(Qy(Qdt. 


Problème de Dirichlet 
Le problème de Dirichlet, dans un ouvert 
borné A de R'", pour une fonction continue 
fdonnée sur la frontière V de A, consiste à 
trouver la fonction, unique d’après le prin- 
cipe du maximum, continue sur : 

Â = aut, 

harmonique sur A, qui coïncide avec f sur 
T. En 1877, C. G. Neumann proposait la 
méthode suivante pour la solution de ce 
problème, en supposant m =. 2 et T pour- 
vue d’une tangente continue ; on désignera 
par L(T) la longueur de la courbe T. 

Soit (£, q) le point courant de T, d’abs- 
cisse curviligne a, et (a, (3) les cosinus 
directeurs de la normale en ce point orien- 
tée vers A. On appelle potentiel de double 
couche d’une densité continue /J sur T la 
limite, quand Ô tend vers 0, du quotient par 
2 ô de la différence entre le potentiel de la 
densité p au point (£-[-0(5, f| — f- (3Ô) et celui 
de la densité — p au point (£, q). Le potentiel 
de double couche est la fonction : 


h{x,y) ~ £ L(n fi(a) 


a( X — Q + (Xv — n) icj 
(x — £) 2 + 0 — n) 2 


\xdo, 

Jr 


où diù est l’angle orienté sous lequel, du 
point (je, y) E A, on voit l’arc do de T. Cette 
fonction est harmonique sur A et, en un 
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point (a% y) (E T, d’abscisse curvilignes, elle Supposons maintenant \ ||| X || < 1. 

a pour limite : D’une part, l’équation homogène : 


7rp(s) + J Q L(r) p(a) 


a(x — Q + bO — n) , 
(A-o 2 + (y-n ) 2 a; 


en égalant cette limite à f(x, y), on obtient 
une équation intégrale non homogène où 
les variables sont s et a, mais sans para- 
mètre À. 

Henri Poincaré pressentit, dès 1896, le 
rôle que ce paramètre jouerait dans les 
résultats ; cette intuition fut confirmée en 
1903 par les remarquables travaux du 
Suédois Ivar Fredholm résumés ci-dessous 
(cf. chap. 3). 


2. Méthode 

des approximations successives 

Supposons A compact, le noyau K continu 
sur A 2 et, de même, f dans l’espace de 
Banach C(A) formé des fonctions y conti- 
nues sur A à valeurs complexes, avec la 
norme : 


Ml = sup|>|. 

Au noyau K est associé l’opérateur 
intégral \ 

X E C [C(A), e(A)] 

qui à la fonction y £ C(A) fait correspon- 
dre z = rX. y G C(A) définie par : 

(3) z(x) =J 

1 désignant l’application identique, on 
peut écrire l’équation intégrale (1) : 

(!’) (I -XX>-/, 

et sa résolution revient à inverser l’opéra- 
teur I — ÀX ; or (3) permet de déterminer 
la norme de l’opérateur JC : 


(2’) y = \Xy 


ne peut avoir que la solution identique- 
ment nulle ; d’autre part, la suite y n définie, 
à partir de J’q = 0 par exemple, par la 
formule de récurrence ou d’approxima- 
tions successives (cf. espaces MÉTRIQUES) : 

y n = f + À- n— 1 J 

converge dans C(A) vers la solution de (1), 
à savoir : 

( 4 ) 

«EN 

JC rt+1 étant le (n + l)-ième itéré de l’opé- 
rateur X, ou l’opérateur intégral associé au 
noyau itéré K ( " +,) défini par récurrence 
par : 

KW = K 


et, pour n ^ 1, par : 

( 5 ) K> +»)(*, £) 


= K(x,OK(M 2 )... 

J A" 


On met la solution (4) sous la forme : 


(6) y=(I + ÀS*)/ 

en introduisant l’opérateur intégral 
associé au noyau résolvant : 

r\ = \ m K<» + « ; 

«GN 


puisque (6) donne la solution unique de 
(1), les opérateurs I — ÀX et I -j- ÀSx sont 
inverses l’un de l’autre, d’où résulte, pour 
À [ || X | < 1 et | ju 1 1| X | < 1, la relation 
fondamentale entre noyaux résolvants : 


l|x||= sup f |K(jt,Ç)|rfÇ. 

xGaJa 


( 7 ) (Sx - SJ/fr - M) =S X S M =S M 
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Vito Volterra étudia le cas particulier 
A = [a, b], a < b, K(A, £) = 0 pour 
£ > J, K(x, £) fonction continue de (x, £) 
pour a ^ t, ^ x ^ b. Dans ce cas, l’équa- 
tion (1) s’écrit : 

(8) y(x)-\\ x K{x,ï)y(ï)dt =f(x), 

va a 

et la définition (5) des noyaux itérés 
entraîne : 

|KC + »(*,Ok^=^(*ijp|K|)* + 1 
n ! a 

pour l ^ x, 

Ç) = 0 pour l > x. 

C’est donc pour tout À G C, et non plus 
seulement pour À J JC || < 1 comme dans 
le cas général, que, d’une part, l’équation 
homogène n’a que la solution identique- 
ment nulle, puisqu’elle entraîne 
y = À"X"V pour tout n ; que, d’autre part, 
la série (4) converge dans C(A) vers la 
solution de (8) ; enfin, on a la relation (7) 
quels que soient À et p. 

Les difficultés que présente le cas géné- 
ral furent surmontées par les deux mémoi- 
res de Fredholm de 1901 et de 1903. 


3. Méthode de Fredholm 


1 ^ n ^ /?, a pour limite, quand le plus 
grand des diamètres des oq, tend vers 0, le 
monôme : 


(9) 


j — *)" 

n! 





n ^ 1, 


où la notation de Fredholm : 



désigne le déterminant des n 2 fonctions 
K(,v„ ij), i et j = 1, n. 

Le monôme (9) est le terme général 
d’une série entière convergente pour tout 
A E C ; en ajoutant à la série un terme 
constant égal à 1, on obtient une fonction 
entière D(A) appelée déterminante du 
noyau K et aussi déterminante du noyau 
transposé K défini par : 

(10) K(*,y= K(U). 

Le produit de cette déterminante et du 
noyau résolvant est encore une fonction 
entière de A : 


D(x,K;X) = D(X)T x (x } Q 


+ K(x, y. 


Supposons toujours A compact et le noyau 
K continu sur A’. Si l’on partage A en p 
parties A, de mesures a,-, i = 1, . . . . /?, et si 
l’on choisit x } E A, pour chaque indice /, on 
peut considérer le système linéaire : 


.K*/) — X ^ a jK(x„Xj)y(Xj) =/(*,), 


1 = 1,...,/», 


comme une approximation de (1) ; or son 
déterminant est un polynôme en A de 
degré ^ /?, dont le terme de degré n , 


Le premier théorème de Fredholm 
affirme que, si D(h) ^ 0, pour tout second 
membre f E C(A), l’équation (1) a une 
solution unique, encore donnée par (6), 
avec maintenant : 


r\ç*, y 


D(x, £ ; X) 
D(X) ’ 


c’est donc une fonction méromorphe du 
paramètre X, et l’on a la relation (7) quels 
que soient A et p. 

Si au contraire X est valeur singulière du 
noyau K, c’est-à-dire D(A) = 0, le deu- 
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xième théorème de Fredholm affirme que 
chacune des équations homogènes (2) et : 

(2) z(x) = ,f Ki (lx)z(i)di 

a des solutions formant un espace vectoriel 
de dimension finie d(k) > 0 commune aux 
deux équations et au plus égale à l’ordre de 
multiplicité de la racine A de la détermi- 
nante. 

Si v est solution de (1) et z solution de 
(2), on a : 

f f{x)z{x)dx = f y(x)z(x)dx 
Ja Ja 

- A J K (£>,x)y(x)z(£) dx di = 0, 

d’où d(k) conditions linéaires que le second 
membref’de ( 1) doit vérifier pour que (1) 
ait une solution ; le troisième théorème de 
Fredholm affirme que ces d{\) conditions 
nécessaires sont aussi suffisantes. 

De ces trois théorèmes se dégage Y alter- 
native de Fredholm ; 

1. Ou bien l’opérateur I — À JC est inver- 
sible dans C[C(A), C(A)] ; 

2. Ou bien l’opérateur I -AS. n’est ni 
injectif ni surjectif, son noyau étant de 
dimension finie, son image étant fermée et 
de codimension finie. 

Le deuxième cas se présente pour les 
valeurs de À qui annulent la déterminante : 
si donc il y en a, elles sont en nombre fini 
ou forment une suite *■ oo, chaque 
éventualité pouvant se présenter. 


4. Rincipaux cas particuliers 

Dans le CÜS de Volterra (cf. supra, fin du 
chap. 2), la déterminante ne peut s’annu- 
ler. On retrouve ce fait en remarquant que : 

K(*\.. M =K(x 1 ^ 1 )...K(x n ,x /J ), 

\X j - X n / 


si .Y], x n sont deux à deux distincts, 
d’où : 


D(h) = exp — À \K{x,x)dx 


Le cas de Goursaî est celui où le noyau 
K est de la forme : 


K (*. y = ^ h i (x)k i (Ç), 
1 = 1 


les h, étant linéairement indépendantes 
dans C(A), ainsi que les k,. Dans ce cas, on 
a 



pour n > p ; dont D(A) est un polynôme 
de degré ^ p et le noyau K a au plus p 
valeurs singulières. 

Le noyau K est dit hermitien si : 

K = K, 

c’est-à-dire si : 


x ) = K(x, O» 

quels que soient x et £ 6 A. Dans ce cas, 
chaque déterminant de Fredholm : 



est réel et les valeurs singulières aussi ; car : 
y — XSky 

entraîne la relation : 

Jj y(x)\ 2 dx = \ L K(x , Qÿ (x (Ç) dx d y 

où les deux intégrales sont réelles. Le 
noyau K a certainement au moins une 
valeur singulière s’il n’est pas identique- 
ment nul, et il a certainement une suite A,„. 
m £ N, de telles valeurs singulières, si le 
noyau n’est pas un noyau de Goursat. Le 
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cas particulier de Goursat étant exclu, on 
a les formules : 


(lla) lw = L K{ " ){x ' x)dx ’ n>2 ’ 


et : 

(11 b) D(X) = exp I 


K (x 9 x)dx\ 


n('-è) 


exp- 


La richesse et la précision des résultats 
obtenus dans cette théorie, pour des 
noyaux quelconques et plus encore pour 
des noyaux hermitiens, ne sont pas seule- 
ment admirables par elles-mêmes : elles ont 
contribué largement à l’essor, au XX e siècle, 
de l’analyse fonctionnelle en général, à 
l’essor de la théorie des opérateurs linéai- 
res et à celui de la théorie des espaces 
préhilbertiens ou hilbertiens en particulier. 


5. Opérateurs compacts 

Propriété de compacité 

L’inégalité de Schwarz, appliquée à ( 3 ), 
donne ; 

U(*)l 2 < f LKÇ)l 2 rfï f |K(*,9| 2 </£ 

i!a Ja 


et : 

z(x')—z(x) I 2 

< f |j>(t)| 2 rf£ f I K(x , £) — K(x Ç) 1 2 </Ç- 
Ja Ja 

Ces inégalités suggèrent les hypothèses 
suivantes sur le noyau K : l’espace C’(A) 
contient chaque fonction : 

K, 

et l’application x — > K v est une application 
continue de A dans C’(A). 


Sous ces hypothèses, réalisées en par- 
ticulier si K est continu sur le compact A’, 
que l’on munisse C(A) de la norme : 

\\y\\ = supjy | 

A 

comme aux chapitres 2 et 3, ou que l’on 
munisse C(A) de la norme : 

IM = [JV(Q ! 2 ^] 1/2 

définissant une topologie strictement 
moins fine, l’opérateur intégral X a cette 
propriété (obtenue en appliquant le théo- 
rème d’Ascoli à la suite bornée équicon- 
tinue X y n ) que, pour toute suite y„ bornée 
dans C(A), la suite JC y contient une suite 
partielle convergente dans C(A). 

Cette propriété de l’opérateur JC fut 
dégagée, puis étudiée dans un espace 
vectoriel normé quelconque E, par le 
Hongrois Frédéric Riesz, sous le nom de 
complète continuité, auquel on préfère 
aujourd’hui celui de compacité : elle 
entraîne en effet la continuité de l’opéra- 
teur, mais s’oppose à ce qu’il ait un inverse 
continu, du moins si E est de dimension 
infinie. 

La seconde norme sur C(A) indiquée 
ci-dessus a sur la première l’avantage de 
munir C(A) d’une structure préhilber- 
tienne (cf. espace de hilbert, chap. 1) 
permettant de considérer d’autre part des 
opérateurs autoadjoints (cf. ci-dessous). 

Valeurs spectrales 

Soit E un espace vectoriel normé quelcon- 
que et JC E C(E, E) : on dit qu’un nombre 
complexe C est valeur spectrale de JC si 
l’opérateur JC (I n’est pas inversible 
dans C(E, E), valeurpropre de JC si X CI 
n’est pas injectif ; ceci entraîne cela, et 
réciproquement, si E est de dimension 
finie. 
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Soit E de dimension infinie et X com- 
pact : alors, la valeur 0 est spectrale, mais 
elle n’est pas propre en général ; au 
contraire, si ( 7^ 0, on a pour l’opérateur 
JC ÇI l’alternative de Fredholm telle 
qu’elle a été énoncée à la fin du chapitre 3, 
de sorte qu’une valeur C ^ 0 est propre si 
et seulement si elle est spectrale. S’il y a de 
telles valeurs, elles sont en nombre fini ou 
forment une suite tendant vers 0. 

Opéra teuradjoint 

Supposons désormais que la norme de E 
lui donne une structure préhilbertienne, 
donc qu’elle est associée à un produit 
scalaire, noté (_x j') ; on dit alors que deux 
opérateurs JC et JC* £= C(E, E) sont 
adjoints si : 

(Xx\y)= (*| X*y), 

quels que soient x et y G E, et que X est 
autoadjoint s’il est son propre adjoint. 
Ainsi, lorsque E est égal à C(A) muni de 
la seconde norme indiquée supra (cf. 
Propriété de compacité ), les opérateurs 
intégraux associés aux noyaux K et 
K* =K sont adjoints. 

Si X et X* sont adjoints et compacts, 
on retrouve le troisième théorème de 
Fredholm sous la forme suivante : L’image 
de l’opérateur X — CI est I e supplémen- 
taire orthogonal du noyau de son adjoint 
X* — ci. 

Soit enfin X compact autoadjoint : ses 
valeurs spectrales sont réelles, les noyaux 
de X CI et JC C I sont orthogonaux si 
C C et si I X I ou J X I est valeur 
spectrale. 

Les valeurs spectrales peuvent former 

un ensemble fini (Co» Cii • • • • C»}> avec Co = 
0. Alors, le supplémentaire orthogonal du 
sous-espace engendré par les noyaux des : 

X™C m I, m- b — n 


est stable par X et la restriction de X à ce 
supplémentaire est un opérateur compact 
autoadjoint sans autre valeur spectrale que 
0, donc nul ; cela veut dire que tout vecteur 
y G E est la somme de ses projections 
orthogonales y m sur les noyaux des 
X — C m I> m = 0, 1, .... fl, d’où les formu- 
les : 

n n 

(12) &y =^ç m >v 

m = 0 m — 1 

qui définissent parfaitement l’opérateur X 
et permettent, par exemple, de traiter 
l’équation : 

(X — Xl)y = z, 

où z est donné : si A n’est pas valeur 
spectrale, l’équation a pour solution uni- 
que : 

<13 > ’-Ztr±v 

m = 0 

où z m est la projection orthogonale de z sur 
le noyau de : 

K-C.I; 

si, au contraire, A est une valeur spectrale 
C M , l’équation n’a de solutions que si 
z M = 0 ; ces solutions sont encore données 
par (13), à ceci près que le terme de rang 
p est remplacé par un élément quelconque 
du noyau de : 

fc-Cpl. 

Les valeurs spectrales de X peuvent 
aussi former une suite C w tendant vers 
Co = 0, et les formules (12) et (13) subsis- 
tent à condition que les séries qu’elles 
contiennent convergent dans E : mis à part 
le cas A = 0, il suffit pour cela que E soit 
complet ou soit un espace de Hilbert. On 
remarque, à ce sujet, que C(A) n’est pas 
complet : pour un opérateur intégral X 


609 



INTEGRATION & MESURE 


dans C(A), associé à un noyau K hermitien 
mais non noyau de Goursat, donc possé- 
dant une suite de valeurs spectrales, on a 
pourtant le remarquable théorème de 
Hilbert-Schmidt, d’après lequel la deu- 
xième série (12) converge uniformément 
vers la fonction Jvy\ 

MICHEL HERVÉ 
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INTÉGRATION & MESURE 


L a théorie de l’intégration joue en 
mathématique un rôle extrêmement 
important. C’est une théorie riche et com- 
plexe. Il ne sera pas question ici d’en 
donner une description exhaustive ni d’en 
aborder les assez redoutables aspects tech- 
niques. On s’efforcera de mettre en 
lumière les grandes idées simples qui y sont 


à l’œuvre et de montrer comment elles lient 
les aspects les plus élémentaires de la 
théorie de la mesure aux développements 
les plus généraux de la théorie de l’inté- 
gration. 

fa 


1. Le problème initial 
Généralités 

Mesurer est une activité dont l’existence 
est attestée dans toutes les sociétés histo- 
riques, et il est assez surprenant de cons- 
tater que ce n’est que dans un passé 
relativement récent, au début du XX e siècle, 
que la réflexion mathématique a com- 
mencé à en établir une théorie claire et 
cohérente. 

Il faut tout de suite remarquer que le 
problème, pris dans sa plus grande géné- 
ralité, reste encore mystérieux : on ne sait 
pas encore très clairement, par exemple, le 
sens qu’il faut donner au mot « mesurer », 
ni même si on peut vraiment lui donner un 
sens dans le domaine des sciences humai- 
nes, bien qu’on ait l’impression qu’une 
bonne conception de la mesure puisse y 
être l’origine de progrès décisifs. 

Il faut encore remarquer que le mot 
« mesure » a, en mathématique, un sens 
plus restreint qu’en physique, et que ce que 
le mathématicien appelle théorie de la 
mesure ne s’applique directement qu’à une 
partie de l’activité du physicien et ne vise 
que la structure conceptuelle à l’exclusion 
des procédés expérimentaux de détermi- 
nation des valeurs numériques qui relèvent 
de la métrologie. 

Ce qui a retardé la naissance d’une 
bonne théorie de la mesure a été l’inca- 
pacité où est demeurée longtemps l’huma- 
nité de distinguer nettement entre ce que 
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l’on mesure d’une part et l’échelle avec 
laquelle on mesure d’autre part, et de 
concevoir clairement ce qui les lie. 
L’échelle est constituée par le corps 
ordonné R des nombres réels, dont la 
théorie définitive n’a été élaborée qu’à la 
fin du XIX e siècle (G. Cantor, R. Dede- 
kind), mais qui avait été déjà presque 
totalement construit par le mathématicien 
grec Eudoxe, au IV e siècle avant J.-C., sous 
le nom, que la tradition a conservé, de 
mesure des grandeurs (et de rapports de 
grandeurs), qui est révélateur de la confu- 
sion signalée plus haut. En réalité, Eudoxe 
ne considérait que ce que nous appelons 
les nombres réels positifs. Il le faisait d’une 
manière rigoureusement correcte et extrê- 
mement pure : il est émouvant pour le 
mathématicien contemporain de constater 
le souci, très moderne, qu’a montré 
Eudoxe de ne rien introduire qu’il ne 
puisse construire par combinaison de 
concepts préalablement bien délimités. 
Mais sa construction, impeccable au point 
de vue de la rigueur, en ce qui concerne 
l’édification d’une échelle de valeurs, était 
beaucoup moins claire en ce qui concerne 
les « grandeurs ». Elle était en outre d’une 
complexité qui l’a rendue inutilisable pour 
la plupart de ses successeurs ; ceux-ci ne 
l’ont pas comprise et n’en ont retenu que 
des bribes, qu’ils se sont transmises avec 
une telle persévérance qu’on les trouve 
encore à l’état de vestiges peu intelligibles 
dans la plupart des manuels élémentaires. 
Ce qui a manqué à Eudoxe, c’est une autre 
idée très moderne qui consiste, lorsque 
l’on a construit, à partir d’un matériel 
conceptuel initial, de nouveaux êtres 
mathématiques très complexes par rap- 
port aux éléments initiaux, à considérer les 
propriétés essentielles de ces nouveaux 
êtres et à repartir en les prenant à leur tour 
comme éléments initiaux d’une nouvelle 


construction, Dans la construction 
d’Eudoxe, comme dans celle de Dedekind, 
un réel apparaît comme un ensemble de 
rationnels, chaque rationnel étant lui- 
même un ensemble de couples d’entiers ; 
mais Eudoxe reste fidèle au langage des 
entiers, tandis que Dedekind dégage expli- 
citement la structure du corps totalement 
ordonné archimédien et complet des réels. 
(À noter d’ailleurs que l’axiome dit 
d’Archimède est explicitement attribué à 
Eudoxe par Archimède lui-même.) 

C’est l’apparition presque simultanée 
d’une bonne théorie des nombres réels et 
de la notion d’ensemble qui a créé les 
conditions favorables à la naissance de la 
théorie moderne de la mesure. 

Formulation de la question 

Reprenons la question dans un cas simple : 
tout le monde a appris à calculer la surface 
ou l’aire de certaines régions du plan, et les 
mathématiciens des siècles passés ont 
consacré beaucoup d’efforts à calculer les 
aires de régions de plus en plus compli- 
quées, sans jamais cependant dire très 
explicitement pourquoi ils menaient leurs 
calculs comme ils le faisaient, ni ce qu’ils 
attendaient du résultat. Expliciter les idées 
non formulées qui présidaient à ces recher- 
ches n’eut pas pour seul effet de satisfaire 
les exigences de rigueur et d’esthétique du 
mathématicien, cela lui permit de forger 
les outils propres à déterminer, puis à 
étendre le domaine de validité de ces 
calculs et de les effectuer dans tous les cas 
où ils sont valables. 

Qu’attendons-nous en effet de ces 
calculs d’aire ? Ils permettent (une unité 
d’aire étant choisie) d’attribuer à chaque 
région du plan d’un certain type un nom- 
bre réel positif que l’on appelle son aire, la 
propriété essentielle étant souvent expri- 
mée par le fait que l’on peut « ajouter » des 
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aires, ce que l’on peut décrire sous une 
première forme en disant que, si une 
région R apparaît comme formée de deux 
régions R, et R-, « qui n’empiètent pas 
l’une sur l’autre », l’aire de R est la somme 
des aires de R, et de R 2 . Deux régions telles 
que l’on puisse les « transporter » (au 
moins idéalement) l’une sur l’autre ont des 
aires égales. 

Si l’on veut préciser ces idées, il faut 
d’abord savoir ce que l’on entend par 
« région » du plan. Le plan étant considéré 
comme un ensemble dont les éléments 
sont les points, le projet le plus ambitieux 
sera de considérer que tout sous-ensemble 
du plan doit avoir une aire. Cela signifie- 
rait donc que l’on peut définir une appli- 
cation m (appelée mesure universelle) de 
l’ensemble Y(P) de toutes les parties du 
plan P dans l’ensemble des nombres réels 
positifs, et que cette application a les 
propriétés d’additivité et d’invariance par 
isométrie. 

Additivité . Pour tout couple (A, B) de 
parties disjointes du plan (c’est-à-dire telles 
que A H B = 0), on a : 

m ( A U B) = m (A) + m (B). 

Cette condition peut être également 
formulée sous la forme équivalente sui- 
vante : 

m (0) = 0, 

et alors, pour tout couple de parties (A, B), 
du plan : 

m (A U B) + m (A Pi B) = m (A) H- m (B) ; 

ce qui permet de préciser le sens de « ne 
pas empiéter l’un sur l’autre » par « avoir 
une intersection d’aire nulle ». 

Invariance par isométrie . Quelle que 
soit la partie A du plan, et quelle que soit 
l’isométrie T du plan (une isométrie est une 


bijection du plan sur le plan qui conserve 
la distance), on a : 

m [t(A)] = m (A) . 

Cette définition précise étant donnée, deux 
problèmes se posent : Existe-t-il de telles 
applications ? Si oui, en existe-t-il une 
seule, ou plusieurs ? Il est clair que, s’il en 
existe une, que nous appellerons m, et, si 
À est un réel positif fixe, Xm en est une 
autre. L’unicité recherchée ne sera donc 
qu’une unicité à un facteur près, Cela dit, 
la réponse aux questions posées est si peu 
évidente qu’on a, en réalité, les résultats 
suivants. Il existe une telle application dans 
le cas du plan, mais l’unicité n’est pas 
assurée. Il n’existe pas de telle application 
dans l’espace euclidien à trois dimensions 
(où l’on parle alors de volume et non plus 
d’aire), ni pour les espaces euclidiens à plus 
de trois dimensions. 

Espaces mesurés 

La non-existence ou la non-unicité amè- 
nent à restreindre nos ambitions initiales et 
à reposer le problème en essayant de 
définir l’application non pas sur l’ensemble 
de toutes les parties du plan ou de l’espace, 
mais sur un sous-ensemble. Pour donner 
une formulation plus générale, nous allons 
abandonner le plan et supposer que l’on 
part d’un ensemble X quelconque : Sur 
quelles parties A de T(X) est-il raisonnable 
de chercher à définir une application 
additive ? 

Une première exigence est que, si A et 
B sont deux parties disjointes de X qui 
appartiennent à A, leur réunion appartient 
aussi à A . Mais il est plus commode 
d’exiger que, quelles que soient les par- 
ties A et B éléments de A, alors A U B soit 
aussi élément de A, L’ensemble A U B est 
d’autre part la réunion de A et de B — A 
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qui sont disjoints, et il est commode que 
B — A appartienne aussi à A. 

Ce qui s’est effectivement révélé être la 
bonne structure pour l’ensemble A est 
exprimé par la condition suivante : Pour 
tout couple (A, B) d’éléments de jt, alors 
A U B et A B sont éléments de A. (On 
peut montrer que cette condition est équi- 
valente au fait que la différence symétrique 
A À B et l’intersection A fl B sont élé- 
ments de A, si A et B le sont.) On dit alors 
que A est un clan de parties de X, ou 
quelquefois un anneau de Boole (A a une 
structure d’anneau pour les opérations A et 

n (cf. ANNEAUX ET ALGEBRES, Ch&p. 2). 

On dira alors qu’une application addi- 
tive m de A dans l’ensemble R+ des 
nombres réels positifs est une mesure (en 
précisant, si besoin est, simplement addi- 
tive) ou encore une étendue ( content , 
Inhalt ). La situation fondamentale est le 
triplet (X, il, m), où A est un clan de 
parties de X, et m une application additive 
de A dans R + . Un tel triplet est souvent 
appelé un espace mesuré. 

Dans certains cas, il peut être intéres- 
sant (comme dans le cas de l’aire et du 
volume) d’avoir une propriété d’inva- 
riance par rapport à un sous-groupe G du 
groupe des bijections de X sur X, ce qui 
signifie que, pour tout g G G et tout 
A G A, on ag(A) G A et w[g(A)] = m( A), 
mais la théorie ne se limite pas à ce cas. 

L’exemple le plus ancien d’espace 
mesuré qui ait été considéré par l’humanité 
est celui où X est un ensemble, A l’ensem- 
ble de ses parties finies, et m( A) le nombre 
d’éléments de la partie finie A, et l’on peut 
dire que c’est à partir de ce cas, par 
extensions successives, qu’a été dévelop- 
pée toute la théorie de la mesure. 

Notons que, l’intersection d’une famille 
de clans étant un clan, il existe toujours un 
plus petit clan contenant une partie donnée 


de T(X) : on dit alors que ce clan est 
engendré par la partie. On peut montrer 
qu’il existe des mesures non triviales (c’est- 
à-dire ne prenant pas uniquement la valeur 
0) sur tout clan. 

Voici des exemples usuels et importants 
d’espaces mesurés. 

(a) X = R, et A est l’ensemble des réu- 
nions finies de semi-segments [ a , b[ 
(a ^ x < b ), avec m([a, b[) = b a. Il y a 
invariance par rapport aux translations de 
R. Cette mesure n’est autre que la lon- 
gueur. On notera qu’il est préférable de 
considérer la longueur comme une applica- 
tion de A dans R + , plutôt que de parler de 
la mesure de la longueur, qui, ou bien est un 
pléonasme, ou bien se réfère à un concept 
de longueur défini indépendamment, ce qui 
complique inutilement la situation. 

(b) X est un segment [a, P] de la droite, et 
A est le clan engendré par les semi- 
segments [a, b[ et les segments [ a , P]. On 
définit m au moyen d’une fonction positive 
croissante g définie sur [a, P] en posant 
m{[a, x[) = g(x) et m ([a, P]) = g(P). On 
peut interpréter m comme une masse. Si g 
n’est pas affine, cette masse m n’est pas 
« uniformément répartie ». 

(c) X est le plan et A est l’ensemble des 
réunions finies de rectangles dont les côtés 
ont des directions fixes, et la mesure d’un 
rectangle est le produit des longueurs de ses 
côtés. Il y a invariance par rapport au 
groupe des translations du plan. 

(cl) X est un ensemble d’éventualités, A un 
clan d’événements, avec X G A, et m une 
probabilité, à qui est imposée la condition 
m(X) = 1. 

Les exemples les plus classiques repré- 
sentés par ce schéma concernent, comme 
ci-dessus, les longueurs, les aires, les volu- 
mes, les masses et les probabilités : l’inclu- 
sion de la théorie des probabilités dans la 
théorie de la mesure (A. KolmogorofF) a 
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été l’origine du développement moderne 
de la première et d’un considérable enri- 
chissement de la seconde. 

Extension d'une mesure 

La formulation moderne du problème que 
les mathématiciens s’efforçaient de résou- 
dre en calculant les mesures d’ensembles 
de plus en plus complexes est la suivante : 
Étant donné un espace mesuré (X, A, m ), 
est-il possible de déterminer d’autres tri- 
plets (X, A, m), où A C A et où m est une 
extension de m à A ? 

L’idée d’une solution remonte-t-elle 
aussi à Eudoxe ? Soit A une partie de X 
n’appartenant pas à A, mais telle qu’il 
existe au moins un élément (3 G A avec 
AC p. On considère alors tous les éléments 
a G A tels que a C A (il en existe : il y a au 
moins l’ensemble vide) et tous les éléments 
P G A tels que AC p. On a donc : 

ex C A C p. 

Or, m étant additive et positive, m est 
croissante (c’est-à-dire que a C p entraîne 
m(a) w(P)). On en déduit alors que la 
borne supérieure de l’ensemble des nom- 
bres m(a) est au plus égale à la borne 
inférieure de l’ensemble des nombres 
m( P). L’idée est que l’on pourra étendre m 
aux ensembles pour lesquels ces deux 
bornes sont égales, et le résultat qui justifie 
tous les calculs classiques est le suivant : La 
famille des ensembles A pour lesquels la 
borne supérieure des m(a ) et la borne 
inférieure des m( p) sont égales est un 
clan A qui contient A, et, en posant : 

m (A) = sup m(a), 

on obtient une mesure sur A dont la 
restriction à A est m. En général, A est 
strictement inclus dans 5f(X), et l'applica- 
tion du même procédé à (X, A, m) 
redonnerait le même triplet. 


Dans le cas des aires planes, partant de 
l’espace mesuré de l’exemple (c), on trouve 
tous les ensembles qualifiés classiquement 
de quarrables , et l’espace mesuré est inva- 
riant pour les isométries du plan : on 
obtient l’aire classique la plus générale. 


2. Linéarisation 
et intégrale de Riemann 

Soit (X, A, m) un espace mesuré. A chaque 
élément A de A, associons sa fonction 
caractéristique (p A et considérons les com- 
binaisons linéaires à coefficients réels de 
ces fonctions caractéristiques : on obtient 
des fonctions dites étagées (relativement à 
A) et leur ensemble V a une structure 
naturelle d’espace vectoriel réticulé. Si cp et 
ip sont deux éléments de V, Slip(cp, lp) et 
inf(cp, ip) appartiennent aussi à V. 

On peut alors associer à m une forme 
linéaire 1 sur V, en posant : 

m = ^ x,«( a,) 

pour : 



et l’on vérifie que, si (p s’exprime de deux 
manières différentes comme combinaisons 
linéraires de fonctions (p A ., on obtient bien, 
dans les deux cas, la même valeur pour 
I(cp). La linéarité de I est évidente. En 
outre, si cp ^ 0, on a I(cp) ^ 0. 

On peut alors poser un problème 
d’extension de la forme I à un espace 
vectoriel contenant V. Le procédé classi- 
que de l’intégration de Riemann est l’ana- 
logue du procédé d’ Eudoxe pour l’exten- 
sion des mesures et peut être ainsi décrit. 
On considère les fonctionsfdéfinies sur X 
à valeurs dans R, qui ont la propriété 
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d’être bornées et de s’annuler hors d’un 
ensemble A y G A. On peut encadrerfpar 
des fonctions étagées (p et tp telles que 
cp < f < ip. On a donc : 

m < m, 

sup {I(cp) 1 9 G V, cp </} 

< inf (I(ip) | ip G V,/ < ip} ; 

on montre que l’ensemble des fonctions 
pour lesquelles l’égalité a lieu dans la 
formule précédente est un espace vectoriel 
réticulé V qui contient V, et que, si l’on 
prend pour I (/) la valeur commune aux 
deux bornes, on définit sur V une forme 
linéaire positive I qui prolonge 1. 

Tel est l’essentiel de l’intégration au 
sens de Riemann. Remarquons que, par- 
tant de (X, A, m ), la famille des ensem- 
bles A dont les fonctions caractéristiques cp 
appartiennent à Y n’est autre que A , et que 
I(<p) n’est alors autre que m( A). On ne perd 
donc rien, et on gagne beaucoup à procé- 
der à cette linéarisation et à travailler sur 
des espaces vectoriels de fonctions et sur 
leurs formes linéraires positives. 

Un problème technique concernant 
cette intégration est de savoir, suivant 
l’espace mesuré (X, A, m ), ou l’espace Y, 
dont on part, si l’on peut caractériser indé- 
pendamment de l’intégration les fonctions 
de V : dans cet ordre d’idées, si X est 
localement compact, et si A contient tous 
les compacts de X, toutes les fonctions 
continues à support compact appartien- 
nent à V. Plus particulièrement, si (X, A, m) 
est l’espace mesuré de l’exemple (b), où m 
est définie à partir d’une fonction crois- 
sante g, toutes les fonctions continues réel- 
les sur [a, P] sont intégrables, et l’intégrale 
est appelée l’intégrale de Riemann-Stieltjes 
par rapport à g et est souvent notée : 


Une fonction y à variation bornée étant 
la différence de deux fonctions croissantes 
p et n , on peut définir l’intégrale de toute 
fonction continue j par rapport à v en 
posant : 

f7 dv= [fdp-\*fdn 

va va va 

et on a : 

|JYv| < V(«, P)||/ II, 

où | f | est la norme uniforme de /, définie 
par : 

ll/ll = sup{ |/(x)|, x G [a, b]} ; 

V(a, P) est la variation absolue de v entre 
Ü et P, soit : 

V(a, (3) = sup ^ \f(pc k )—f(pc k _ l )\, 

où la borne supérieure est prise par rap- 
port à l’ensemble des subdivisions finies 
a = Xq < *i < < X n _ } < X n = P de 
l’intervalle [a, P]. 

Autrement dit, sur l’espace de Banach 
des fonctions continues réelles définies sur 
[a, P], les intégrales de Riemann-Stieltjes 
sont des formes linéaires continues. En 
1909, F. Riesz a prouvé qu’elles étaient les 
seules. 

3. La théorie de Lebesgue 

L’odditivité dénombrable 
On s’est efforcé, dans ce qui précède, de 
mettre en lumière les idées implicites 
essentielles de la théorie classique de la 
mesure et de l’intégration telle qu’elle s’est 
développée non sans difficultés des Grecs 
à Riemann, et qui constitue ce que l’on 
peut appeler la théorie élémentaire de la 
mesure. 
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Mais, historiquement, cette prise de 
conscience de ce qui intervenait fonda- 
mentalement dans la théorie classique s’est 
produite en même temps, sinon plus tard 
que l’introduction d’une nouvelle idée 
extrêmement féconde, due à E. Borel, et 
qui est celle de l’additivité dénombrable. 

Reprenons un triplet (X, et suppo- 

sons que le clan $ contient non seulement 
les réunions finies de ses éléments, mais 
aussi les réunions dénombrables, c’est-à- 
dire supposons que la réunion de toute 
famille dénombrable d’éléments de soit 
un élément de On dit alors que $ est une 
tribu , ou encore un o-anneau (de Boole). 

Supposons que p soit non seulement 
additive, mais vérifie la condition sui- 
vante : Pour toute famille dénombrable 
(A/), i N d’éléments de $ deux à deux 
disjoints, on a : 

j G N / G N 

on dit alors que p est dénombrable ment 
additive (ou o-additive). C’est cette situa- 
tion qui a été envisagée par Borel et qui est 
toujours, sauf précision limitative, dési- 
gnée par le terme espace mesuré. 

Un premier problème est celui de 
l’existence de tels triplets. Il est évident 
qu’il existe des tribus : pour tout ensem- 
ble X, l’ensemble îf(X) de ses parties est 
une tribu. De plus, l’intersection de toute 
famille de tribus étant une tribu, il existe, 
pour toute partie C de :I’(X), une plus petite 
tribu qui la contient ; on appelle cette 
dernière la tribu engendrée par C. 

L’existence d’une mesure o-additive a 
posé un problème plus redoutable, qui a 
été résolu par Lebesgue suivant une voie 
que l’on peut schématiser, dans un cadre 
plus général que le sien, de la façon 
suivante : Partons d’un triplet (X, A, ni). 


où A est un clan et m une mesure 
simplement additive, et considérons la 
famille D( A) des parties A de X telle que 
chacune de ces parties soit incluse dans la 
réunion d’une famille dénombrable (a/), 
î 6 N, d’éléments de A. On peut considé- 
rer la somme : 

m(aO, 

iE N 

qui est un réel positif ou oo, et désigner 
par m*(A) la borne inférieure de l’ensem- 
ble de ces sommes obtenues en considérant 
toutes les familles dénombrables d’élé- 
ments de A dont la réunion contient A. 
L’idée est que m*(A) doit fournir une 
approximation par le haut (en langage plus 
mathématique, un majorant) de l’éven- 
tuelle mesure de A. On définit ainsi une 
application m* de D(A) dans R + (union 
de R + et de {-f- 00} ). Il est clair qu’une 
réunion dénombrable d’éléments A,- de 
D(A) est un élément de D(A) et l’on a : 

m *(u A <) * y «w 

(ên frrtf 

Cette propriété, plus faible que la 
o-additivité, est appelée la (J-SOUS- 
additivité, et m * est qualifiée de mesure 
extérieure associée à (X, A, m). 

On considère alors les éléments A de 
D(it) tels que l’on ait, pour tout élément 
E de D(A) : 

m *(E) = m *(A O E) + m *(CA O E), 

et on montre que leur ensemble est une 
tribu qui contient A et que la restriction 
p de m* à & est o-additive. Les éléments 
de sont qualifiés (T ensembles mesura- 
bles, ou (A, w)-mesurables si on veut 
rappeler leur origine. 

Lebesgue a d’abord démontré ce résul- 
tat dans le cas où X est un segment de la 



616 



INTÉGRATION & MESURE 


droite, A le clan engendré par les seg- 
ments, et m la longueur. Le même proces- 
sus peut être appliqué à la droite entière, 
et la mesure obtenue, qui prolonge la 
longueur et qui est invariante par transla- 
tion, est appelée mesure de Lebesgue de la 
droite. (Le même procédé réussit pour les 
aires, les volumes et l’on parle encore de 
mesure de Lebesgue dans R 2 , R 3 , R rt .) 

Il faut noter que $ est en général 
strictement incluse dans :I’(X) et on démon- 
tre par exemple, dans le cas de la droite, 
qu’il est impossible d’étendre la mesure de 
Lebesgue à IJ'(X) tout entier. 

La tribu J] dépend de A et de m, mais 
3\ contient toujours la plus petite tribu 
contenant A. En particulier, dans le cas de 
R", la tribu des ensembles mesurables au 
sens de Lebesgue (A étant le clan engendré 
par les produits d’intervalles bornés, appe- 
lés pavés, et m le volume n-dimensionnel) 
contient la tribu engendrée par les pavés, 
qu’on appelle tribu boi'élietVW de R", elle 
contient tous les ouverts et tous les fermés 
de R". (Ses éléments sont appelés boréliens 
de R".) 

Dans tous les cas, la tribu $ est 
complète par rupport à p, en ce sens que, si 
AE.'B avec p(A) = 0, toute partie de A 
appartient aussi à $ et a aussi une mesure 
nulle. Le triplet (X, Ji, p) a été construit à 
partir du triplet (X, A, m) et on a A C 3 ; 
p est-elle une extension de m ? En général, 
on a seulement pour a (E A : 

M(a) 6m(«); 

l’égalité est assurée pour tout Q E A, si et 
seulement si, pour tout élément a de A qui 
est réunion d’une famille dénombrable 
d’éléments deux à deux disjoints cq, de A, 
on a : 

m (a) = ^ m (a,) ; 


c’est ce qui est réalisé pour les longueurs, 
les aires, les volumes... 

L'intégrale de Lebesgue 

En même temps qu’il démontrait l’exis- 
tence de mesures o-additives, Lebesgue 
définissait l’intégrale qui porte son nom. 

Dans le cas simple de fonctions réelles 
bornées milles hors d’un élément de Æ de 
mesure finie, le processus indiqué pour 
l’intégrale de Riemann conduit, à condi- 
tion de partir des fonctions étagées relati- 
ves à (X, p), à l’intégrale de Lebesgue. 

Les fonctions bornées nulles hors d’un 
ensemble mesurable de mesure finie qui 
sont intégrables sont alors exactement 
celles que Lebesgue a appelées mesurables, 
c’est-à-dire celles qui donnent pour image 
réciproque de tout borélien de R un 
ensemble mesurable (c’est-à-dire apparte- 
nant à 3). Signalons en passant que cette 
notion de fonction mesurable (dont la 
dénomination n’est d’ailleurs pas heu- 
reuse) est très importante et se définit de 
façon générale dans la situation suivante : 
A étant une tribu de parties d’un ensemble 
X, et une tribu de parties d’un ensemble 
(p, une application f de X dans (p est dite 
(A, %)-mesurable si l’image réciproque de 
tout élément de $ est un élément de A. Si 
une mesure p a été définie sur A, cela 
permet d’en définir une v sur en posant, 
pour tout B 6 Æ : 

v(B) = MlA-'(B)]. 

Pour les fonctions bornées, la différence 
essentielle entre l’intégration de Riemann 
et celle de Lebesgue réside dans le fait que 
la première part d’un clan et d’une mesure 
simplement additive et la seconde d’une 
tribu et d’une mesure o-additive, fait qui 
avait été obscurci par certains commen- 
taires déclarant que, dans le cas de fonc- 
tions réelles définies sur un segment de R, 


617 



INTEGRATION & MESURE 


Riemann partageait le domaine de la 
variable et Lebesgue celui de la fonction, 
ce qui ne correspondait qu’à deux maniè- 
res d’obtenir des fonctions étagées (que ni 
l’un ni l’autre n’utilisaient explicitement). 

Lebesgue ne se limitait en outre pas aux 
fonctions bornées ou définies sur des 
ensembles de mesure finie, mais il étendait 
son intégrale de telle sorte qu’elle appa- 
raissait finalement comme une forme 
linéaire positive T, classiquement notée : 

K/) = J x /rfd. 

sur l’espace £*, ou, si l’on veut préciser, 
£'(X, jil), des fonctions intégrables qui 
est un espace vectoriel réticulé, avec les 
propriétés suivantes : 

(Cl’) /(= £ ] est équivalent à |/| (= £ ] . 

(/>') Sur £‘, I( |yi ) est une semi-norme. La 
relation : 

i(l /— «d = o 

est équivalente au fait que / et g prennent 
les mêmes valeurs sauf aux points d’un 
ensemble de mesure nulle, ce que l’on 
traduit en disant qu’elles sont égales pres- 
que partout . L’égalité presque partout est 
une relation d’équivalence, et l’espace 
quotient est un espace vectoriel normé, 
classiquement noté L J (X, ju) qui a la 
remarquable propriété d’être complet, 

(/') Si f n est une suite croissante de fonc- 
tions intégrables, telles que la suite IV;,) 
converge, la suite f } converge simplement 
presque partout (c’est-à-dire sauf aux 
points d’un ensemble de mesure nulle) vers 
une fonction intégrable / telle que : 

KO = lim K/„)- 

n 

(d f ) Théorème de la convergence dominée . 
Si une suite de fonctions intégrables f 
converge presque partout vers une fonc- 


tion f et s’il existe une fonction intégrable 
g telle que, pour tout n (z N, on ait 
| j„ ^ g, alors f est intégrable et : 

I(f) = lim I (/„). 
n 


4. L'intégrale comme forme linéaire 

Le fait que l’intégrale est une forme 
linéaire sur un espace vectoriel de fonc- 
tions est si fondamental qu’il peut en 
constituer une définition ; cependant cette 
importance n’était pas encore perçue au 
moment où Lebesgue créait son intégrale. 
Un des résultats qui contribua le plus à 
dégager le rôle de cette notion fut le 
théorème de F. Riesz, déjà cité, sur l’iden- 
tité entre les intégrales de Stieltjes des 
fonctions continues réelles définies sur un 
segment [a, b\ et les formes linéaires conti- 
nues sur l’espace de Banach que consti- 
tuent ces fonctions. Les idées de Riesz 
furent étendues par J. Radon, dont le nom 
est désormais associé aux formes linéaires 
continues sur l’espace Y des fonctions 
continues à support compact définies sur 
un espace localement compact X, 
l’espace V étant muni de la topologie de la 
convergence compacte ; l’hypothèse de 
continuité que l’on impose ici à une forme 
linéaire m sur V s’exprime par le fait que, 
pour tout compact K de X, il existe une 
constante M(K) telle que : 

m (/) < M(K)|/IL 

où : 

ll/IL = sup|/(x)| 

jcGX 

pour toute fonction f G V nulle en dehors 
de K. L’aspect linéaire a paru tellement 
important aux mathématiciens contempo- 
rains, et en particulier à Bourbaki, qu’ils 
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utilisent le terme de mesure de Radon pour 
désigner non plus des fonctions o-additives 
d’ensembles, mais les formes linéaires 
décrites ci-dessus. 

Un autre pas en direction de la linéa- 
risation fut accompli par l’Américain 
P. J. Daniell, qui exposa une théorie de 
l’intégration comme méthode de prolon- 
gement d’une forme linéaire positive pré- 
sentant une « continuité » convenable. 

Une théorie de l’intégration est d’abord 
l’étude du prolongement d’une forme 
linéaire, continue en un certain sens, sur un 
espace vectoriel de fonctions à un espace 
vectoriel plus vaste. Le cœur de la question 
est que cet espace plus vaste se présente 
naturellement sous deux formes différentes 
- comme complété d’un espace vectoriel 
topologique dont les éléments sont a priori 
des classes d’équivalence de suites de 
Cauchy (cf. espaces métriques, espaces 
vectoriels NORMÉS), ou comme quotient, 
relativement à une relation d’égalité pres- 
que partout, d’espaces de fonctions) - dont 
il s’agit de montrer qu’elles sont isomor- 
phes. 

Voici le schéma d’une telle théorie 
(selon M. H. Stone). 

(a”) Le départ est un espace vectoriel V 
réticulé d’applications d’un ensemble X 
dans R, contenant inf( 1 , /) s’il contient fi 
et une forme linéaire positive I sur V telle 
que : 

l/l < 2>.| => KI/IX 

(h”) Cela étant, on associe à toute appli- 
cation f de X dans R la quantité N (fi) 
(réelle positive ou égale à + oo) définie 
par : 

N (/)= inf (,^i (| / |) ) 


où la borne inférieure est prise par rapport 
à l’ensemble des suites (fi n ) de fonctions de 

V telles que : 

/< £|/.| ; 

ne N 

on a alors : 

i€N /€N 

on se restreint alors à l’ensemble G des 
fonctions f pour lesquelles N (f) est fini. 
L’ensemble G est un espace vectoriel qui 
contient V et sur lequel N est une semi- 
norme. 

Le résultat essentiel est que G est 
complet pour cette semi-norme. 

(c") On considère alors l’adhérence V de 

V dans G qui est un espace complet pour 
la semi-norme N ; on peut prolonger de 
manière unique, par continuité, I en une 
forme linéaire I continue (relativement a 
N) sur V. Puisque / s’annule sur le 
sous-espace des fonctions telles que 
N (f) = 0, on peut définir une forme J sur 
l’espace quotient fi) de V pour la relation 
d’équivalence N (f — g) = 0, et fi} est un 
espace de Banach. Si, comme c’est souvent 
le cas, N(/) = 0 entraîne f — 0 si f €: V, 
alors V est isomorphe à un sous-espace de 
fi) et on peut considérer J comme le 
prolongement de 1 de V à fi). 

I et V ont toutes les propriétés signalées 
plus haut pour l’intégrale de Lebesgue et 
les espaces C'(X, p) ; V est l’espace 
C^(X, tft, fi) pour la tribu J*> engendrée par 
les ensembles E dont les fonctions carac- 
téristiques appartiennent à V, avec 
y(E) = Ï(X E ). L’espace fi} correspond à 
L*(X, Æ, fi) et J est la forme déduite de 
l’intégrale par le passage au quotient. 

Une situation extrêmement importante 
déjà signalée, mais qui entre dans ce cadre 
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général, est le cas où V est l’espace des fonc- 
tions réelles continues à support compact 
définies sur un espace localement compact 
et où 1 est une forme linéaire continue sur V 
muni de la topologie de la convergence 
compacte, c’est-à-dire le cas des mesures de 
Radon, qui s’expriment comme différences 
de deux formes positives. 

Enfin signalons, sans donner le moindre 
détail, qu’il est possible de définir, en en 
conservant la linéarité et une continuité 
convenablement définie, des intégrales à 
valeurs non plus seulement réelles, mais 
dans C, dans R” et plus généralement dans 
les espaces vectoriels topologiques locale- 
ment convexes. 

Espace L p 


Pour p — 2, on a q = 2 et l’espace L 2 
est isomorphe à son dual topologique. 
L’inégalité de Hôlder prend la forme 
particulière appelée inégalité de Schwarz : 



<N 2 (/)N 2 (jr); 


Ixfg <4* ne dépend que des classes de f et 
de g et permet de définir un produit 
scalaire sur L 2 qui apparaît alors comme 
un espace de Hilbert et joue un rôle 
extrêmement important en analyse harmo- 
nique et en physique quantique. 

On désigne par l’espace des fonc- 
tions mesurables bornées presque partout. 
C’est un espace vectoriel sur lequel on peut 
définir une semi-norme N x (/), égale au 
plus petit réel positif k tel que l’ensemble : 


Aux espaces C 1 et L*(X, JC p) peuvent être 
associés d’autres espaces remarquables, 
dont une des définitions peut être présentée 
comme suit : Appelant mesurables les fonc- 
tions réelles, qui sont (JC B)-mesurables, où 
B est la tribu borélienne de R, l’espace U } 
pour p ^ 1, est constitué des fonctions 
mesurables telles que \f\ p S C 1 , C’est un 
espace vectoriel sur lequel N /; définie par : 

iw) = (J x | f\>d2f /p 


est une semi-norme. La relation N p (f) = 0 
est équivalente à l’égalité presque partout, 
et l’espace quotient relativement à cette 
relation, L/(X, JC p), est normé et complet. 

De plus, si p > 1. le dual topologique 
de L p est isomorphe à si : 



et on a l’inégalité dite de Hôlder, pour 
/G L/ et g G V 1 : 



< N,(/)N,(*). 


UGX|/(x)> k } 

soit de mesure nulle. L’espace quotient, 
relativement à l’égalité presque partout, est 
noté L°°. Il est normé et complet. Il est 
isomorphe au dual topologique de L 1 , mais 
il n’y a pas cette fois réciprocité ; le dual de 
contient au moins un sous-espace 
isomorphe à L 1 , mais le contient stricte- 
ment. 

Mesure de Haar 

La longueur, l’aire, le volume sont des 
mesures de Radon invariantes par les 
translations de R, R 2 , R\ 

Un résultat très général et très impor- 
tant, dû à Haar, généralise cette situation : 
Soit G un groupe topologique localement 
compact, dont l’opération est notée mul- 
tiplicativement. Si s est un élément du 
groupe, à toute fonction continue à sup- 
port compactfon peut associer la fonction 
f s , également continue à support compact, 
définie par : 

/«(*) =f(s-‘x) 
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Le théorème de Haar affirme qu’il 
existe alors une mesure de Radon sur G 
unique (à un facteur près) invariante à 
gauche, c’est-à-dire telle que, pour tout 
s £= G et pour toute fonction / 

Vf,) = Vf)- 


5. Intégration et dérivation 

Un très célèbre théorème d’analyse classi- 
que énonce que, si f est une fonction 
continue réelle définie sur [a, b], l’applica- 
tion : 

est dérivable et admet f(x) pour dérivée au 
point x. 

En vertu de ce théorème, intégration et 
dérivation sont souvent présentées comme 
des « opérations inverses » l’une de l’autre. 

En réalité, la recherche des primitives 
(ce qui est vraiment l’inversion de la 
dérivation) et l’intégration ne coïncident 
nullement, car les fonctions intégrables ne 
sont pas toutes des fonctions dérivées, et 
les fonctions dérivées ne sont pas toutes 
intégrables. 

Le problème de la recherche des pri- 
mitives de la fonction dérivée la plus 
générale a été résolu par A. Denjoy dans 
sa belle et difficile théorie de la totalisa- 
tion. 

Mais le problème peut être présenté 
autrement : partant d’un espace mesuré 
(X, Ji, |u) et d’une fonction intégrable/ on 
peut définir une mesure v sur en 
prenant pour valeur v(A) de la mesure 
d’un élément A de J3 l’intégrale de /x A , où 
X\ est la fonction caractéristique de A. 
Réciproquement, v étant une mesure sur 


Jl, existe-t-il une fonction intégrableftelle 
que, pour tout A E on ait : 

v(A) = J/Xa^IJ? 

La réponse est fournie par le théorème 
de Radon-Nikodym (d’ailleurs énoncée et 
démontrée par Lebesgue dans le cas où p 
est la mesure de Lebesgue sur R), que nous 
ne donnerons pas dans sa plus grande 
généralité : Si XE J3 et p(X) < -j- oo, la 
condition nécessaire et suffisante pour que 
v puisse s’exprimer par : 

v(A) =JVx A d\i, 

est que, pour tout ensemble B de 
ù(B) = 0 =* v(B) = 0. 

La fonction j n’est évidemment déter- 
minée que presque partout, mais est uni- 
que à cela près, et peut être considérée 
comme une densité de la mesure v par 
rapport à la mesure p : c’est, en fait, la 
meilleure manière et la plus générale de 
concevoir la notion de densité. 

ANDRÉ REVUZ 
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LIMITE NOTION DE 


L a notion de limite fait son apparition 
dans un ouvrage du mathématicien 
anglais B. Robins intitulé A DisCOUVSe 
Conceming the Nature and Certainty of Sir 
îsaac Newton ’s Method 0 f Fluxions und 
Prime and Ultimate Ratios (1135) ; c’est 
une réponse aux critiques formulées par le 
philosophe G. Berkeley à l’encontre du 
calcul infinitésimal dans son célèbre pam- 
phlet The Analyst (1734). Robins essaie de 
préciser et de clarifier l’expression un peu 
obscure de Newton « premières et derniè- 
res raisons », en parlant de limites vers 
quoi tendent, sans jamais les atteindre, des 
rapports de quantités variables ; il a dû 
soutenir une controverse contre son com- 
patriote J. Jurin, newtonien orthodoxe et 
sourcilleux, pour qui les premières et 


dernières raisons étaient effectivement 
atteintes (à l’instant de naissance ou d’éva- 
nouissement). 

C. Maclaurin, dans son Treatise oj 
Fluxions (1742), présenté lui aussi comme 
une réponse à Berkeley, reprend l’inter- 
prétation des « premières et dernières 
raisons » de Newton en termes de limites ; 
cependant il fonde le calcul infinitésimal 
sur la notion de fluxion (vitesse instanta- 
née) et non sur celle de limite. Au 
contraire, d’Alembert, dans l’article « Dif- 
férentiel » de L'Encyclopédie , vol. IV, 
1754, présente la notion de limite comme 
la « vraie métaphysique du calcul différen- 
tiel » : il y définit le rapport différentiel 
dyjdx comme la limite du rapport des 
accroissements finis de y et de .v lorsque ces 
accroissements tendent vers 0, et il insiste 
sur le fait que l’on ne doit pas séparer les 
« différentielles » dy et dx. Comme pour 
ses prédécesseurs Robins et Maclaurin, le 
langage de D’Alembert est entièrement 
géométrique, et la notion de limite n’est 
pas très clairement définie : on dit simple- 
ment que le rapport considéré peut devenir 
aussi proche que l’on veut de sa limite, ou 
encore qu’une « grandeur est la limite 
d’une autre grandeur, quand la seconde 
peut s’approcher de la première plus près 
qu’une quantité donnée, si petite qu’on 
puisse supposer, sans pourtant que la 
grandeur qui s’approche puisse jamais 
surpasser la grandeur dont elle s’approche, 
en sorte que la différence d’une pareille 
quantité à sa limite est absolument inassi- 
gnable » (on remarque que, pour d’Alem- 
bert, la limite est approchée d’un seul 
côté). Cependant, d’Alembert prend soin 
d’établir l’unicité de la limite. Il n’a jamais 
mis en œuvre son programme de construc- 
tion du calcul différentiel à partir de la 
notion de limite : dans tous ses écrits 
scientifiques, il utilise le langage des infi- 
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niments petits, langage commun aux 
mathématiciens continentaux du XVIII e siè- 
cle. 

Quelques successeurs de D’Alembert 
ont donné des exposés du calcul infinité- 
simal fondés sur la notion de limite. On 
peut citer A. G. Kâstner, Anfangsgründe 
der Analysis des Unendlichen (1761), 
ouvrage assez maladroit qui comporte des 
incohérences ; S. L’Huillier, Exposition 
élémentaire des principes des calculs supé- 
rieurs (1787), primé par l’Académie de 
Berlin, où les limites sont présentées 
comme une interprétation de la « méthode 
d’exhaustion » des mathématiciens grecs : 
sa définition de limite n’est pas plus claire 
que celle de D’Alembert, et toujours en 
langage géométrique, « Étant donné une 
quantité variable, toujours plus petite ou 
plus grande qu’une quantité donnée ; mais 
qui peut différer de celle-ci de moins 
qu’une quantité arbitraire, si petite soit- 
elle ; cette quantité constante est appelée la 
limite en grandeur ou en petitesse de la 
quantité variable », Le Traité de calcul 
différentiel et intégral de Lacroix (1797), 
qui a connu de nombreuses rééditions et a 
été traduit en anglais, est aussi fondé sur la 
notion de limite, et il a sans doute beau- 
coup fait pour populariser cette notion. 

La mise en œuvre de la notion de limite 
au XVIII e siècle se heurtait à un certain 
nombre d’obstacles : le langage géométri- 
que ne fournissait pas un domaine numé- 
rique homogène où développer la théorie, 
et la notion générale de fonction n’était pas 
encore assimilée. Il était donc difficile de 
concevoir clairement comment une gran- 
deur ou un rapport variable tendaient vers 
leurs limites : des objections du genre de 
celle de Zénon d’Elée pouvaient être oppo- 
sées, ce qui faisait dire à Lagrange que la 
notion de limite paraissait soulever des 
difficultés métaphysiques. Le concept de 


limite s’est progressivement clarifié au XIX e 
siècle : dès 1800, C. F. Gauss avait une 
conception extrêmement claire de la limite 
d’une suite de nombres réels (a,), puisqu’il 
la définit (dans un travail inédit Notions 
fondamentales sur la théorie des suites) 
comme la valeur commune à lim sup a n et 
lim inf a, lorsque ces deux limites extrê- 
mes, qui sont définies de manière précise, 
coïncident. A. L. Cauchy a imposé la 
notion de limite à la base du calcul 
infinitésimal ; la définition qu’il en donne 
est encore un peu vague : « Lorsque les 
valeurs successivement attribuées à une 
même variable s’approchent indéfiniment 
d’une valeur fixe, de manière à finir par en 
différer aussi peu que l’on voudra, cette 
dernière est appelée la limite de toutes les 
autres » (résumé des « leçons » données à 
l’École royale polytechnique sur le calcul 
infinitésimal, 1823) ; mais il introduit une 
notation lim pour la limite, et il montre sur 
des exemples numériques comment se 
comportent les limites. 

La définition très précise de limite que 
l’on donne encore dans les cours remonte 
à Weierstrass, promoteur du « style des 
epsilons ». Pour que la théorie soit entiè- 
rement claire, il ne manque alors qu’une 
théorie satisfaisante des nombres réels, qui 
permettrait d’établir l’existence d’une 
borne supérieure pour une partie non vide 
majorée et de démontrer le critère de 
Cauchy, admis jusqu’alors comme une 
évidence ; diverses théories des nombres 
réels ont été élaborées vers 1860-1870 
(Dedekind, Weierstrass, Méray, Cantor). 

La notion de limite a été étendue hors du 
cadre numérique par la topologie générale 
au XX e siècle ; dans les espaces métriques, 
on peut tout ramener à la définition de la 
limite d’une suite de points, qui est formel- 
lement identique à la définition de la limite 
d’une suite de nombres, mais dans les espa- 
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ces plus généraux, les suites ne suffisent 
plus : on a d’abord utilisé une sorte de 
généralisation des suites, avec un ensemble 
d’indices non dénombrable (convergence à 
la Moore-Smith), puis la notion de filtre 
introduite par H. Cartan (1937) ; de cette 
dernière notion est dérivée celle d’ultrafiltre 
qui a fourni un puissant moyen de construc- 
tion et de démonstration en topologie géné- 
rale et en logique. 

CHRISTIAN HOUZEL 


LINÉAIRE & MULTILINÉAIRE 

ALGÈBRE 


L J algèbre linéaire sur un corps commu- 
tatif, telle qu’on la trouvera présentée 
ici, s’est progressivement dégagée, au cours 
du XIX e siècle et au début du XX e , de la 
théorie des équations linéaires (systèmes de 
n équations linéaires à p inconnues, équa- 
tions différentielles et intégrales linéaires) 
et de la géométrie (calcul vectoriel dans les 
espaces affines, transformations des espa- 
ces projectifs, dualité pour les sous-variétés 
linéaires et les quadriques, structure même 
de la géométrie). L’algèbre multilinéaire 
sur un corps commutatif a pris naissance 
dans la théorie des invariants et dans la 
partie de la géométrie différentielle consa- 
crée au calcul tensoriel. Plus récemment, 
on a développé l’algèbre linéaire sur un 
anneau afin d’appliquer les méthodes de 
l’algèbre linéaire sur les corps à la théorie 
des groupes abéliens, considérés comme 
Z-modules, à la théorie des entiers algébri- 
ques sur un anneau commutatif unitaire, 
considérés comme éléments d’un module 
sur cet anneau, à la représentation linéaire 
d’un groupe dans un espace vectoriel, 


considéré comme module sur l’algèbre de 
ce groupe, et à l’étude des formes quadra- 
tiques sur Z. Enfin, ces dernières années 
ont été introduites l’algèbre homologique 
et, plus généralement, la théorie des caté- 
gories abéliennes, permettant d’appliquer 
la théorie des modules à des domaines où 
elle semblait inopérante (théorie des fibrés 
vectoriels et des faisceaux). 

On trouvera un aperçu historique plus 
complet dans l’article algèbre. D’autre 
part, on trouvera des détails sur les appli- 
cations de l’algèbre linéaire dans de nom- 
breux articles tels que groupes - Groupes 
classiques et géométrie, Groupes de Lie et 
théorie des nombres - Nombres algébri- 
ques. Bien entendu, la liste précédente 
n’est pas exhaustive : on pourrait, à la 
limite, affirmer que l’algèbre linéaire a 
envahi tous les domaines des mathémati- 
ques. A titre d’exemple, on consultera les 
applications à la théorie des équations 
algébriques et à l’analyse fonctionnelle (cf. 
équations aux DÉRIVÉES PARTIELLES, distri- 
butions, algèbres normées, espaces vecto- 
riels NORMÉS). 

Dans le présent article sera d’abord 
exposée la théorie des espaces vectoriels 
sur un corps commutatif, indépendam- 
ment de la notion de dimension. L’expli- 
citation des résultats obtenus lorsque les 
espaces vectoriels sont de dimension finie 
et munis de bases fait l’objet du paragra- 
phe consacré au calcul matriciel. Dans 
cette partie, l’exposé reste élémentaire, et 
la plupart des théorèmes sont accompa- 
gnés de démonstrations. Suivent quelques 
indications sur l’algèbre tensorielle et la 
théorie des modules. 

En ce qui concerne la réduction des 
endomorphismes et la théorie des formes 
quadratiques, on se reportera aux articles : 
théorie spectrale et formes QUADRATI- 
QUES. 
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1. Espaces vectoriels 
et applications linéaires 

Espaces vectoriels 

Soit K un corps commutatif, On appelle 
espace vectoriel sur K, ou encore K-espace 
vectoriel, un ensemble E muni de deux lois 
de composition : une loi interne, applica- 
tion de E X E dans E, notée {x, y) ► X -h y 
et une loi externe, application de K X E 
dans K, notée (a, x) | — ► a . x, ou encore 
(a, x) >— ► ax ; ces deux lois satisfaisant aux 
conditions suivantes : 

(a) L’ensemble E, muni de l’addition, est 
un groupe commutatif. 

(b) Pour tout couple (a, p) d’éléments de 
K et pour tout élément x de E : 

a . (P .x) = (ap) . x, 

et, pour tout élément X de E, 1 . x = x. 

(c) Pour tout couple (a, P) d’éléments de K 
et pour tout couple (x, y) d’éléments de E : 

(a + p) .x = a .x -F P >x, 

a.(x+y) = a.x + a.y . 

Les éléments de E sont souvent appelés 
vecteur les éléments de K scalaires. 

Applications linéaires 

Soit E et F deux espaces vectoriels sur un 
même corps commutatif K. On dit qu’une 
application U de E dans F est K-linéaire 
ou, plus simplement, linéaire si, pour tout 
couple (x, x) d’éléments de E et pour tout 
couple (a, P) de scalaires : 

U(ou + fiy) = cxU(x) + pu oo. 

On dit aussi que U est un morphisme 
d’espaces vectoriels. 


UNÉAIRE & MULTILINÉAIRE ALGÈBRE 

Soit E, F et G trois espaces vectoriels 
sur K. Pour toute application linéaire U de 
E dans F et pour toute application linéaire 

Y de F dans G, l’application composée 

V o U est linéaire. 

On dit qu’une application linéaire U de 
E dans F est un isomorphisme de E sur F 
s’il existe une application linéaire Y de F 
dans E telle que : 

VoU = I E et Uo V = I F . 

Une application linéaire de E dans 
lui-même s’appelle endomorphisme de E, et 
un isomorphisme de E sur lui-même auto- 
morphisme de E. 

Voici quelques exemples d’espaces vec- 
toriels et d’applications linéaires : 

1. Soit ri un entier naturel non nul. 
L’ensemble K" des suites de n éléments de 
K, muni des deux lois définies par les 
formules : 

(£i> ^2» ••*» £«) + (Hi » ^2» n*) 

= (£i + n i » £2 + n2j ï>n + n*)* 

ot(£i, £2 , £ n ) = (a£i, a£ 2 , .... a£„), 

est un espace vectoriel sur K. 

2. Soit A un ensemble non vide et F un 
espace vectoriel sur K. L’ensemble F A , 
noté encore .^(A, F), des applications de 
A dans F, muni des deux lois définies par 
les formules : 

</+ £)(*) =/{*)+ £(*)> 

(af)(x) = af(x ), 

est un espace vectoriel sur K. 

3. Soit (F j)j£[ une famille d’espaces 
vectoriels sur un même corps commuta- 
tif K. L’ensemble produit : 

IP 

161 

muni des deux lois suivantes : 

(*/)/e 1 + ObPei = (*/ + yùte 1» 
a(*/)/ei = 
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est un espace vectoriel sur K, appelé 
espace vectoriel produit de la famille 
(F,)®. (Lorsque tous les espaces vecto- 
riels F, sont égaux à un même espace 
vectoriel F, l’espace produit n’est autre que 
F 1 .) Pour tout élément j de I, le projecteur 
canonique de l’espace produit sur F„ qui 
à toute famille (x,) /ei associe le vecteur Xp 
est une application linéaire surjective. 

4. Soit E un espace vectoriel sur K. On 
appelle forme linéaire sur E une applica- 
tion linéaire de E dans K, le corps K étant 
considéré comme espace vectoriel sur 
lui-même. 

Par exemple, soit E l’espace vectoriel 
des fonctions continues sur l’intervalle [0, 1] 
à valeurs complexes. L’application qui à 
tout élémentfde E associe le scalaire : 

£'/(*)<& 

est une forme linéaire sur E. 

Sous-espaces vectoriels 
Soit E un espace vectoriel sur K, (x,) /e j une 
famille de vecteurs de E, (a-).^ une famille 
de scalaires dont le support J est fini. (On 
appelle support de (0(/)/ei l’ensemble J des 
éléments / de 1 tels que a, 0.) Pour toute 
partie finie H de I contenant J : 

i G H / G J 

Cette somme se note encore : 



i€ I 


Cette convention permet de poser la 
définition suivante : On dit qu’un vecteur x 
de E est combinaison linéaire des vec- 
teurs Xj s’il existe une famille de 

scalaires à support fini telle que : 



i E I 


Par exemple, soit E l’espace vectoriel 
des fonctions à valeurs réelles définies sur 
R, et (/„)„£ N la famille des fonctions 
monomiales f n : X ► X n . Les combinaisons 
linéaires de ces fonctions ne sont autres 
que les fonctions polynomiales. En revan- 
che, la fonction exponentielle X ► C x n’est 
pas combinaison linéaire des fonctions /„. 

Soit E un espace vectoriel sur K. On dit 
qu’une partie E’ de E est un sous-espace 
vectoriel de E si E’ est stable pour les deux 
lois de E et si, munie des lois induites, E’ 
est un espace vectoriel sur K. 

Pour qu’une partie non vide E’ de E soit 
un sous-espace vectoriel de E, il faut et il 
suffit que, pour tout couple (x, y) d’élé- 
ments de E’ et pour tout couple (Ot, ( 3 ) de 
scalaires, le vecteur CXX + ( 3 >’ appartienne 
à E’. 

L’intersection d’une famille de SOUS- 
espaces vectoriels de E est encore un SOUS- 
espace vectoriel de E. Il en découle que, 
pour toute partie A de E, l’ensemble des 
sous-espaces vectoriels de E contenant A 
possède un plus petit élément (au sens de la 
relation d’inclusion), à savoir l’intersection 
de tous les sous-espaces vectoriels conte- 
nant A. Ce sous-espace vectoriel, dit engen- 
dré par A, est encore l’ensemble des com- 
binaisons linéaires d’éléments de A, lorsque 
A est non vide. Voici quelques exemples. 

Le sous-espace vectoriel engendré par 
un vecteur x est noté Kx; c’est en effet 
l’ensemble des vecteurs de E de la forme 
ax, où a appartient à K. 

Soit E un espace vectoriel sur K et 
(E/)iei une famille de sous-espaces vecto- 
riels de E. Le sous-espace vectoriel de E 
engendré par la réunion des sous -espaces 
vectoriels E,- est constitué des vecteurs de 
E de la forme : 
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OÙ, pour tout élément / de I, x, appartient à 
E„ et où la famille est à support fini. Ce 

sous-espace vectoriel s’appelle aussi somme 
des sous-espaces vectoriels E,, et se note : 



Dans le cas particulier où I = { 1 , 2 } , la 
somme des sous-espaces vectoriels E, et E 2 
se note E, + E 2 . 

Espaces vectoriels 
d'applications linéaires 

Soit E et F deux espaces vectoriels sur K. 
L’ensemble des applications linéaires de E 
dans F est un sous-espace vectoriel, noté 
C(E, F), de l’espace vectoriel .^(E, F) des 
applications de E dans F. 

Soit E, F et G trois espaces vectoriels 
sur K. L’application V ► V 0 U est une 
application linéaire de C(F, G) dans 
C(E, G), et l’application U ^ V o U une 
application linéaire de C(E, F) dans 
£(E, G). 

En particulier, l’ensemble des endomor- 
phismes d’un espace vectoriel E, muni des 
trois lois de composition : 

(U, V) *-► U + V, 

(U, V) 1 — * V o U, 

(a, U) !-»• aU, 

est une algèbre associative unitaire, notée 

C(E) (cf. ANNEAUX ET ALGEBRES) . Le prO~ 

duit V o U se note encore VU. 

Les automorphismes de E constituent 
un groupe multiplicatif, appelé groupe 
linéaire de E, et noté GL(E) ; c’est le 
groupe multiplicatif des éléments inversi- 
bles de l’anneau unitaire C(E). 

Factorisation des applications linéaires 

Soit E et F deux espaces vectoriels sur K, 
et U une application linéaire de E dans F. 
L’image d’un sous-espace vectoriel de E 


par U est un sous-espace vectoriel de F. En 
particulier, l’image de E par U est un 
sous -espace vectoriel de F, appelé aussi 
image de U, et noté Im(U). De même, 
l’image réciproque d’un sous-espace vecto- 
riel de F par U est un sous -espace vectoriel 
de E. En particulier, l’image réciproque du 
sous-espace vectoriel réduit au vecteur nul 
de F est un sous-espace vectoriel de E, 
appelé noyau de U, et noté Ker(U). Pour 
que U soit injective, il faut et il suffit que son 
noyau soit réduit au vecteur nul de E. 

Théorème l (théorème de factorisa- 
tion). Soit E, F et G : trois espaces 
vectoriels sur K. 

1. Soit U une application linéaire Sur- 
jective de E sur F. Pour toute application 
linéaire V de E dans G telle que Ker(V) 
contienne Ker(U), il existe une application 
linéaire W et une seule de F dans G telle 
que V = W o U. Plus précisément, l’appli- 
cation W ^ W o U est un isomorphisme 
de l’espace vectoriel C(F, G) sur le SOUS- 
espace vectoriel de C(E, G) constitué des 
applications linéaires dont le noyau 
contient celui de U. 

2. Soit U une application linéaire injec- 
tive de F dans G. Pour toute application 
linéaire V de E dans G telle que Tm(V) soit 
contenue dans Im(U), il existe une appli- 
cation linéaire W et une seule de E dans F 
telle que V = U o W. Plus précisément, 
l’application W-W o U est un isomor- 
phisme de l’espace vectoriel C(E, F) sur le 
sous-espace vectoriel de C(E, G) constitué 
des applications linéaires dont l’image est 
contenue dans celle de U. 

Espaces vectoriels quotients 

Soit E’ un sous-espace vectoriel d’un espace 
vectoriel E. La relation binaire dans E défi- 
nie par les couples (_v, y) tels que x — } 
appartienne à E’ est compatible avec les lois 
de E. Muni des lois quotients, l’ensemble 
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quotient est un espace vectoriel sur K, 
appelé espace vectoriel quotient de E par E’, 
et noté E/E'. L’application canonique (p de 
E sur E/E' est linéaire, et son noyau est E’ . 

Le théorème de factorisation montre 
aussitôt que le couple (E/E', cp) possède la 
propriété universelle suivante : 

Pour tout couple (F, U) constitué d’un 
espace vectoriel F sur K et d’une applica- 
tion linéaire U de E dans F dont le noyau 
contient E’, il existe une application 
linéaire U et une seule de E/E' dans F telle 
que U = ù o cp. Plus précisément, l’appli- 
cation V *— 1 - V o cp est un isomorphisme de 
l’espace vectoriel £(E/E', F) sur le SOUS- 
espace vectoriel de C(E, F) constitué des 
applications linéaires de E dans F dont le 
noyau contient E’. 

Voici une conséquence immédiate de la 
propriété universelle des espaces vectoriels 
quotients : Soit E et F deux espaces 
vectoriels sur K, soit U une application 
linéaire de E dans F, soit cp l’application 
canonique de E sur E/Ker(U), soit V 
l’unique application de E/Ker(U) dans 
ïm(U) telle que U(x) = (V o <p)(x), pour 
tout vecteur x de E, et soit i l’injection 
canonique de Im(U) dans F. Alors V est un 
isomorphisme de E/Ker( U) sur Im( U), et : 

u = / o V o cp, 

formule de décomposition canonique de 
U, qui ramène en quelque sorte l’étude de 
U à celles de j, de cp et de V. 

Dualité 

Soit E un espace vectoriel sur K. L’espace 
vectoriel C(E, K) des formes linéaires sur 
E s’appelle espace vectoriel dual de E, et 
se note E*. L’application de E* X E dans 
K, qui au couple (y*, x) associe le scalaire 
>’*(■*), est une forme bilinéaire, dite cano- 
nique, et encore notée : 

(y *, x ) ► (y *, x ). 


Le dual de l’espace vectoriel E*, c’est- 
à-dire l’espace vectoriel des formes linéai- 
res sur E*, s’appelle bidual de E, et se note 
E**. Pour éviter des confusions, nous 
noterons : 

la forme bilinéaire canonique sur 
E** X E*. 

Étant donné un vecteur x de E, l’appli- 
cation de E* dans K, qui à toute forme 
linéaire y * sur E associe le scalaire 
< y*, x > , est une forme linéaire sur E* ; 
c’est donc un élément de E**. L’applica- 
tion ^ qui associe au vecteur x cet élément 
de E**, est une application linéaire de E 
dans E**, dite canonique ; elle est définie 
par la relation : 

«X&0.J*» = 

On dit qu’un vecteur x de E et une 
forme linéaire y* sur E sont orthogonaux 
si <y*, Y> = 0. On dit qu’une partie A 
de E et une partie B de E* sont orthogo- 
nales si, pour tout élément x de A et pour 
tout élément y* de B, x et y * sont 
orthogonaux. L’ensemble des éléments de 
E* orthogonaux à un sous-espace vecto- 
riel F de E est un sous -espace vectoriel de 
E*, appelé orthogonal de F, et noté F 1 . De 
même, l’ensemble des vecteurs de E ortho- 
gonaux à un sous-espace vectoriel G de E* 
est un sous-espace vectoriel de E, appelé 
orthogonal de G, et noté G’. 

Théorème 2. Soit E et F deux espaces 
vectoriels sur K, soit E* et F* leurs duaux, 
et U une application linéaire de E dans F. 
Il existe une application linéaire de F* dans 
E* et une seule, appelée transposée de U et 
notée 'U. telle que. pour tout élément .Y de 
E et pour tout élément y* de F*, 

(1) ( ( V(y*),x)= (y*, U(x) >. 
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L’aplication V n’est autre que l’appli- 
cation y* t— ► y* o U. La relation (1) 
s’appelle identité fondamentale de la trans- 
position. 

L’application U ► 'U est une applica- 
tion linéaire de £(E, F) dans C(F*, E*), 
appelée transposition. 

La transposée de l’application identi- 
que de E n’est autre que l’application 
identique de son dual : 

' I E = U 

Soit E, F et G trois espaces vectoriels 
sur K, soit U une application linéaire de E 
dans F, et V une application linéaire de F 
dans G. Alors la transposée de V o U est 
égale à ‘U o ‘V. En particulier, si G = E, 
et si U est inversible à gauche (resp. à 
droite). r U est inversible à droite (resp. à 
gauche). Plus particulièrement encore, si 
U est un isomorphisme de E sur F, 'U est 
un isomorphisme de F* sur E*, et : 

CU )- 1 = f (U-*) 

L’isomorphisme de E* sur F* ainsi 
défini s’appelle contmgrédient de U, et se 
note Ù. Lorsque F = E, l’application 
U 1 — * Ù est un morphisme du groupe 
GL(E) dans le groupe GL(E*). 

Enfin, pour toute application linéaire U 
de E dans F, le noyau de 'U n’est autre que 
l’orthogonal dans F* de l’image de U : 

Ker('U) = [Im(U)E 
Équations linéaires 

Soit E et F deux espaces vectoriels sur K, 
soit U une application linéaire de E dans 
F, et b un élément de F. On appelle 
équation linéaire définie par U et h l’équa- 
tion : 

(1) U(x) = b. 


Le vecteur b s’appelle second membre 
de l’équation (1). Lorsque b = 0, on dit 
que l’équation (1) est homogène, ou, par 
abus de langage, sans second membre. 
L’équation : 

( 2 ) U(x) = 0 

s’appelle équation linéaire homogène asso- 
ciée à l’équation (1). 

Voici les propriétés de l’ensemble des 
solutions d’une équation linéaire. 

Si l’équation linéaire (1) est homogène, 
ses solutions constituent un sous-espace 
vectoriel de E, à savoir le noyau de U. 
Dans le cas général, si l’équation (1) admet 
une solution .x 0 , on obtient toutes les 
solutions de cette équation en ajoutant à x 0 
une solution quelconque de l’équation 
homogène associée. 

Enfin, pour que l’équation (1) admette 
une solution et une seule quel que soit le 
second membre b , il faut et il suffit que 
l’application linéaire U soit bijective, ou 
encore que sa transposée 'LJ le soit. Dans 
ces conditions, l’unique solution de l’équa- 
tion (1) n’est autre que U -1 (6) ; l’applica- 
tion de F dans E, qui à tout vecteur b 
associe cette solution, est donc linéaire. On 
dit aussi que la solution dépend linéaire- 
ment du second membre. 

On voit donc que les notions d’image et 
de noyau sont fondamentales pour l’étude 
des équations linéaires. 

2. Sommes directes, bases 
Sommes directes 

Soit (E,),£j une famille d’espaces vectoriels 
sur K. Dans l’espace vectoriel : 

E„ 

l’ensemble des éléments (x,)^ à support 
fini est un sous-espace vectoriel de cet 
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espace vectoriel, appelé somme directe de 
la famille (E,) /ei , et noté : 

©e,; 

/€I 

il coïncide avec l’espace vectoriel produit 
lorsque l’ensemble 1 est fini. 

Soit, en particulier, E un espace vecto- 
riel sur K, soit (E,) /eî une famille de 
sous-espaces vectoriels de E, et U l’appli- 
cation linéaire de la somme directe de cette 
famille dans E qui à tout élément (x ; ) ;ei 
associe l’élément : 



Alors l’image de U est la somme : 



des sous-espaces vectoriels E„ et le noyau 
de U est l’ensemble des éléments tels 

que : 



Ainsi, pour que U soit surjective, il faut 
et il suffit que : 



et, pour que U soit injective, il faut et il 
suffit que, pour tout i © I : 

Ei n X Ej = (0) ' 

Lorsque ces deux conditions sont réa- 
lisées, c’est-à-dire lorsque U est un isomor- 
phisme, il est d’usage d’identifier E et : 

©E,. 

iei 

ce qui conduit à dire que E est somme 
directe des sous-espaces vectoriels E,. 


Enfin, pour que E soit somme directe 
des sous-espaces vectoriels E„ il faut et il 
suffit que tout vecteur x de E s’écrive d’une 
manière et d’une seule sous la forme : 



où, pour tout élément i de I, x, appartient 
à E,. 

L’intérêt de la notion de somme directe 
apparaît dans le théorème suivant. 

Théorème 3. Soit E et F deux espaces 
vectoriels sur K, et (Ey)y GJ une famille de 
sous-espaces vectoriels de E dont E est 
somme directe. 

1. Pour tout élément (Uy)y G j de : 

IIC(E„F) ; 

J 

il existe une application linéaire U et une 
seule de E dans F telle que, pour tout 
élément j de J, la restriction de U à E, soit 
égale à U,. À tout vecteur x de E, écrit sous 
la forme : 

ye J 

où, pour toutj © J, x, © Ey, l’application U 
associe le vecteur : 

£ U Mi)- 

2. L’application (Uy)y G j U est un iso- 
morphisme de l’espace vectoriel : 

n C(E;,F) 
yej 

sur l’espace vectoriel : 

c(©e„f) 

J 

En particulier, deux applications linéai- 
res de E dans F ayant, pour tout élémentj 
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de J, même restriction au sous-espace 
vectoriel E, sont égales. 

Sous-espaces vectoriels supplémentaires, 
projecteurs 

On dit que deux sous-espaces vectoriels 
F et G d’un espace vectoriel E sur K 
sont supplémentaires dans E si les trois 
conditions équivalentes suivantes sont 
vérifiées : 

(a) L’espace vectoriel E est somme directe 
de F et de G. 

(b) Tout vecteur x de E s’écrit d’une 
manière et d’une seule sous la forme 
x = y + z, où y G F et z G G. 

(c) La réunion de F et de G engendre E, 
et l’intersection de F et de G est réduite au 
vecteur nul. 

L’application P F qui associe au vecteur 
x le vecteur y est un endomorphisme de E, 
appelé projecteur sur F parallèlement à G. 
Le vecteur y est appelé projection de x sur 
F parallèlement à G. On définit de même 
P,. 

Le projecteur P F a pour image F et pour 
noyau G, et les endomorphismes P F et P G 
satisfont aux relations : 

(1) PfPg = PgPf = 0 

(2) P F 2 = P F et P G 2 = P G 

(3) p f + Pg = 1,. 

Les seules relations P F + P G = I E et 
P P 2 = P F impliquent les relations (1) à 
(3). En effet P F P G = P F (I E P F ) 
= P F P F 2 = 0 ; de même, P G P F = 0 ; 
enfin : 

Pg 2 = (I E » P F ) 2 = I E - 2P F + P F 2 
= I E — P F = P G . 

C’est pourquoi on dit qu’un endomor- 
phisme U de E est un projecteur si U 2 = U. 
L’endomorphisme U est alors le projecteur 
sur Im(U) parallèlement à Ker(U). 


Par exemple, dans l’espace vectoriel 
S 1 ” (A, K) des applications d’un ensemble A 
dans K, le sous-espace vectoriel F des 
applications nulles en un point donné a de 
A et le sous-espace vectoriel G des appli- 
cations constantes sont supplémentaires. 
Le projecteur sur G parallèlement à F est 
l’application /»—*/(#). 

De même, dans l’espace vectoriel sur C 
des fonctions n fois continûment dériva- 
bles sur R à valeurs complexes, le SOUS- 
espace vectoriel F des fonctions polyno- 
miales de degré inférieur ou égal à ri et le 
sous-espace vectoriel G constitué des fonc- 
tions f telles que, pour tout p G [0, n\ 
(D^/)(0) = 0 sont supplémentaires. Le 
projecteur sur F parallèlement à G n’est 
autre que l’application qui à toute fonction 
associe son développement limité à l’ordre 
n au point 0. 

Soit enfin E un espace vectoriel sur K 
et (E,) /G i une famille de sous-espaces vec- 
toriels de E dont E est somme directe. Pout 
tout élément i de I, l’application P, qui 
associe au vecteur x sa i-ième composante 
X, est le projecteur sur E- parallèlement à : 

0Ej 

j*i 

La famille des projecteurs P, satisfait 
aux relations suivantes : 

- Pour tout couple (/, j) d’éléments dis- 
tincts de I, 

P/P j = P ; P/ = 0 ; 

Pour tout élément i de I, 

P/ 2 = P, ; 

- L’application identique de E est égale à 
la somme des projecteurs P,. 

Une famille (P ,) /GI de projecteurs de E 
satisfaisant aux trois conditions précéden- 
tes s’appelle système de projecteurs. 
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L’intérêt de la notion de sous-espaces 
vectoriels supplémentaires apparaît dans le 
théorème fondamental suivant. 

Théorème 4. Soit E et F deux espaces 
vectoriels sur K, U une application linéaire 
de E dans F, E’ un sous-espace vectoriel de 
E, et U’ la restriction de U à E’. Pour que 
U’ définisse un isomorphisme de E’ sur 
Im(U), il faut et il suffit que E’ soit un 
sous -espace vectoriel supplémentaire de 
Ker( U). 

Soit en particulier E, un sous-espace 
vectoriel d’un espace vectoriel E sur K. 
Pour tout sous-espace vectoriel E 2 supplé- 
mentaire de E, dans E, la restriction à E 2 
de l’application linéaire canonique de E 
sur E/E] est un isomorphisme de E 2 sur 
E/E i . (Il suffit d’appliquer le théorème 
précédent au cas où F = E/E], où U est 
l’application linéaire canonique de E sur 
E/E], et où E’ = E 2 .) 

Soit enfin E-> et ES deux sous-espaces 
vectoriels supplémentaires de E, dans E. 
La restriction à E 2 du projecteur sur ES 
parallèlement à E, définit un isomor- 
phisme de E 2 sur ES- (Il suffit cette fois 
d’appliquer le théorème précédent au cas 
où F = E’„ où U est le projecteur sur ES 
parallèlement à E„ et où E’ = E 2 .) 

Ainsi, deux sous-espaces vectoriels sup- 
plémentaires d’une même troisième sont 
canoniquement isomorphes. 

Bases 

Soit K 1 l’espace vectoriel des applications 
d’un ensemble non vide I dans K. L’ensem- 
ble, noté K (I) , des applications de 1 dans K 
à support fini est un sous-espace vectoriel 
de K 1 ; il est égal à K 1 si 1 est fini. 

En particulier, prenons pour I l’ensem- 
ble N des entiers naturels. Alors K N est 
l’espace vectoriel des séries formelles à 
coefficients dans K, tandis que K (N) est 


l’espace vectoriel des polynômes à coeffi- 
cients dans K. 

On notera que : 

K> = n E/ et K<1) = © E/' 

,el <ei 

où, pour tout élément i de I, E, = K. Par 
suite, l’espace vectoriel K- 1 * est somme 
directe des sous-espaces vectoriels où 

pour tout élément i de 1, e, est l’élément de 
K/ 1 * défini par les formules efj) = b y. 
Autrement dit, tout élémentfde K (,) s’écrit 
d’une manière et d’une seule sous la 
forme : 



où a, n’est autre que /(/). 

Théorème 5. Le couple (K (I \ (ê’,)/q) 
possède la propriété universelle suivante : 
Pour tout couple (E, (X/) /e] ) constitué d’un 
espace vectoriel E sur K et d’une famille 
(x } ) iEl de vecteurs de E, il existe une 
application linéaire U et une seule de K (I ^ 
dans E telle que, pour tout élément i de 1, 
U(P;) — X(. L’application U associe à tout 
élément f = (a,)^ le vecteur : 

a 

L’image de U est le sous-espace vecto- 
riel de E engendré par les vecteurs x h et le 
noyau de U est l’ensemble des éléments 
(a,), € | tels que : 

OLjXj = 0 . 

Les éléments de ce noyau sont appelés 
relations linéaires entre les vecteurs X l ; en 
particulier, le vecteur nul de K (I * est appelé 
relation linéaire triviale entre ces vecteurs. 

Ainsi, pour que U soit surjective, il faut 
et il suffit que tout vecteur x de E soit une 
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combinaison linéaire des vecteurs x ( . On 
dit alors que la famille (a,),^ est généra- 
trice. Pour que U soit injective, il faut et il 
suffit que toute relation linéaire entre les 
vecteurs x t soit triviale. On dit alors que la 
famille (x,)^ est libre. Lorsque ces deux 
conditions sont réalisées, c’est-à-dire lors- 
que U est un isomorphisme de K (I) sur E, 
on dit que la famille (x,) /ei est une buse de 
E. Cela revient à dire que tout vecteur X de 
E peut s’écrire d’une manière et d’une 
seule sous la forme : 



La famille (oi/)/g s’appelle famille des 
composantes du vecteur X dans la base 
C*/)rEI* 

Par exemple, la famille est une 

base, dite canonique, de K (1) . En particu- 
lier, lorsque 1 = [ 1, n\, la base canonique 
de K" est constituée des n vecteurs sui- 
vants : 

é? 1 = (1,0,o,....0), 

e 1 = (0, 1, 0, 0), 


e„ = ( 0 , 0 , 0 , .... 1 ). 

De même, l’espace vectoriel 
K[X] = K (N) des polynômes à une indé- 
terminée à coefficients dans K a pour base 
canonique la famille des monômes 
e„ = X'\ où n parcourt N. 

Soit S une partie de E. On dit que S est 
une partie génératrice, une partie libre ou 
une partie basique si la famille (x' v ) ÆS , où, 
pour tout élément s de S, x s = s, est une 
fa mill e génératrice, une fa mill e libre ou 
une base. 

Pour qu’une partie à un seul élément x 
soit libre, il faut et il suffit que le vecteur 
x soit non nul. Lorsqu’une partie { x , y) à 
deux éléments n’est pas libre, on dit aussi 
que les vecteurs A* et y sont colinéaires. 


La notion de base permet d’exprimer 
sous la forme suivante la propriété univer- 
selle de l’espace vectoriel K (I) énoncée 
dans le théorème 5. 

Théorème 6. Soit E et F deux espaces 
vectoriels sur K, et j une famille 
d’éléments de E. Si cette famille est 
génératrice, deux applications linéaires de 
E dans F prenant pour toutj G J la même 
valeur sur le vecteur é) sont égales. Si cette 
famille est une base de E, pour toute 
famille d’éléments de F, il existe 

une application linéaire U et une seule 
de E dans F telle que, pour tout 
j G J, U(é^) — fj. À tout vecteur x de E 
décomposé dans la base B sous la 
forme : 



l’application U associe le vecteur : 

TVr 

U 

Nous pouvons maintenant caractériser 
les applications linéaires injectives et sur- 
jectives à l’aide de la transformée d’une 
base. 

Soit E et F deux espaces vectoriels sur 
K, soit U une application linéaire de E 
dans F, et une base de E. Pour que 

U soit surjective (resp. injective), il faut et 
il suffit que la famille (U(^-))^j soit géné- 
ratrice (resp. libre). Pour que U soit 
bijective, il faut et il suffit que (U(e 7 )) /e j soit 
une base de F. 

Lorsque F = K, le théorème 6 se par- 
ticularise de la manière suivante. 

Théorème 7. Soit E un espace vectoriel 
sur K, et B = (^)yej une base de E. Pour 
toute famille (a y ) /£J de scalaires, il existe 
une forme linéaire y * et une seule sur E 
telle que, pour tout j G J, <}’*, > = Œ/- 
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à tout vecteur x de E décomposé dans la 
base B sous la forme : 



la forme linéaire y* associe le scalaire : 

De plus, l’application (a^j y* est 
un isomorphisme de l’espace vectoriel K J 
sur l’espace vectoriel E*. 

Ainsi, le dual de s’identifie à K J , 
l’application bilinéaire canonique étant 
définie par la formule : 

(°b*)/e j) = a ;Pj- 

En particulier, pour tout entier naturel 
n, l’espace (K")* est canoniquement iso- 
morphe à K". 

3. Existence de bases 

Théorème 8. Soit E un espace vectoriel sur 
K. soit L une partie libre de E, et S une 
partie génératrice de E contenant L. Il 
existe alors une partie basique B de E telle 
que LCBCS. 

Nous allons démontrer ce théorème 
lorsque la partie S est finie. 

Introduisons l’ensemble £ ordonné par 
inclusion des parties libres T de E telles que 
L CT C S. L’ensemble £ est non vide, 
puisque L appartient à C. La partie S étant 
finie, l’ensemble card(T) des entiers natu- 
rels, où T parcourt 6, admet un plus grand 
élément p. Soit B un élément de £ ayant p 
éléments. Montrons que B convient. Puis- 
que B appartient à C, la partie B est libre, 
et L C B C S. Il reste donc à prouver que 
B est génératrice. Supposons en effet par 
l’absurde que le sous-espace vectoriel E’ 


engendré par B ne soit pas égal à E. 
Puisque S est génératrice, il existe un 
élément x de S n’appartenant pas à E’, ce 
qui implique que B’ = B U {*} est encore 
libre. Ainsi, B’ est un élément de £ ayant 
p + 1 éléments, ce qui contredit la défini- 
tion de p. 

Lorsque S est quelconque, la démons- 
tration est analogue, le principe de récur- 
rence étant remplacé par le théorème de 
Zom. 

Corollaire 1. Pour toute partie libre L de 
E, il existe une partie basique B de E 
contenant L ; pour toute partie génératrice 
S de E, il existe une partie basique B de E 
contenue dans S. En particulier, pour tout 
espace vectoriel E sur K, l’ensemble des 
bases de E est non vide. 

Ce corollaire s’obtient en spécialisant le 
théorème aux trois cas suivants : S = E, 

L = 0, S — E et L = 0. 

Corollaire 2 (théorème de la base incom- 
plète). Pour toute partie libre L de E et 
pour toute partie génératrice S de E, il 
existe une partie S’ de S telle que L H S’ 
soit vide et que B = L US’ soit une partie 
basique de E. 

Voici l’une des principales conséquen- 
ces du théorème précédent : 

Théorème 9. Tout sous-espace vectoriel 
E’ d’un espace vectoriel E admet un SOUS- 
espace vectoriel supplémentaire dans E. 

On choisit en effet une partie basique B’ 
de E’, que l’on complète en une partie 
basique B de E. Alors le sous-espace 
vectoriel engendré par B” = B — B’ est un 
sous-espace vectoriel supplémentaire de E’ 
dans E. 

Corollaire 1 . Soit E et F deux espaces 
vectoriels sur K, soit E’ un sous-espace 
vectoriel de E, et U’ une application 
linéaire de E’ dans F. Il existe alors une 
application linéaire U de E dans F pro- 
longeant U’ . 
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Corollaire 2. Soit E et F deux espaces 
vectoriels sur K, soit F’ un sous-espace 
vectoriel de F, et cp l’application linéaire 
canonique de F sur F/F'. Pour toute 
application linéaire U de E dans F/F, il 
existe une application linéaire Y de E dans 
F telle que U = cp o V. 

Corollaire 3. Soit E et F deux espaces 
vectoriels sur K, et U une application 
linéaire de E dans F. Pour que U soit 
surjective, il faut et il suffit que U soit 
inversible à droite, c’est-à-dire qu’il existe 
une application linéaire V de F dans E telle 
que U o V = I F . Pour que U soit injective, 
il faut et il suffit que U soit inversible à 
gauche, c’est-à-dire qu’il existe une appli- 
cation linéaire Y de F dans E telle que 
v o u = I E . 

En effet, il est évident que. si U est 
inversible à droite (resp. à gauche), U est 
surjective (resp. injective). Réciproque- 
ment, si U est surjective, U définit un 
isomorphisme U’ d’un supplémentaire E’ 
de Ker(U) sur F ; il suffit de prendre pour 

V l’application linéaire de F dans E coïn- 
cidant avec U’ *. De même, si U est 
injective, U définit un isomorphisme U’ de 
E sur Im( U) ; il suffit alors de prendre pour 

V l’application linéaire nulle sur un sup- 
plémentaire F’ de Im(U), et coïncidant 
avec U'~ l sur Im(U). 


4. Espaces vectoriels 
de dimension finie 

Définition 

On dit qu’un espace vectoriel E sur K est 
de dimension finie sur K, ou, plus simple- 
ment. de dimension finie, s’il existe une 
partie basique finie de E. Dans le cas 
contraire, on dit que E est de dimension 
infinie. 


Pour qu’un espace vectoriel E soit de 
dimension finie, il faut et il suffit qu’il existe 
une partie génératrice finie de E, puisque 
de toute partie génératrice on peut extraire 
une partie basique. 

Théorème 10. Soit E un espace vectoriel 
de dimension finie sur K, et B une partie 
basique finie de E ayant fl éléments. Alors 
toute partie libre L de E est finie, et le 
nombre p d’éléments de L est inférieur ou 
égal à n. De plus, on peut compléter L en 
une partie basique de E en lui adjoignant 
(n ~ p) éléments convenablement choisis 
dans B. 

Le théorème se démontre en utilisant le 
lemme d’échange suivant, qui fournit en 
outre un procédé pratique de complétion 
de L en une partie basique. 

Lemme. Soit B = (e^ e 2 , ? n ) une 

base de E, soit q un entier inférieur ou égal 
à /?, et Ly = {f [ . . . . f q ) une famille libre 
de E. On suppose que B q = (f j ,/ 2 , .... 
j q b e q-> • • • • e >) est une base de E- Alors il 
existe au moins un entier i G [q y n] tel 
qu’en substituant f 9 à e, dans on 
obtienne encore une base de E, notée B^ +t . 

Il suffit pour cela de décomposer f q 
dans la base B,. Puisque L q est libre, il 
existe au moins un entier i G [q y n] tel que 
la i-ième composante de f .. soit non nulle. 
Il est alors immédiat que cet entier i 
convient. 

Corollaire 1. Soit E un espace vectoriel 
de dimension finie sur K. Toutes les parties 
basiques de E sont finies, et elles ont le 
même nombre d’éléments. 

Il résulte en effet du théorème 10 que 
toutes les parties basiques de E sont finies. 
Soit donc B et B’ deux parties basiques de 
E. ayant respectivement n et n' éléments. 
Comme B est basique et que B’ est libre, 
n' n ; de même, n ^ /?', et finalement 
n = n. 
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Le cardinal commun a toutes les parties 
basiques de E s’appelle dimension de E sur 
K, et se note dim K E, ou, plus simplement, 
dim E. L’espace vectoriel réduit au vecteur 
nul est le seul espace vectoriel de dimen- 
sion 0. Un espace vectoriel de dimension 
1 s’appelle une droite , un espace vectoriel 
de dimension 2 s’appelle un plan. 

Voici quelques exemples : 

Soit 1 un ensemble non vide. L’espace 
vectoriel est de dimension finie si et 
seulement si I est fini, et la dimension de 
K (,) est alors égale à card(I). En particulier, 
pour tout entier naturel non nul ft, est 
de dimension Yl, 

Soit E et F deux espaces vectoriels sur 
K non réduits à {0}, soit B = (ej)^ une 
base de E, et B’ = (/,),£[ une base de F. 
Pour tout élément (i,j) de I X J, désignons 
par Uÿ l’unique application linéaire de E 
dans F telle que, pour tout élément k de J, 

\Jij(e k )= 0 si I et U ij (e J )=f i . 

Les applications linéaires U„ consti- 
tuent une base de l’espace vectoriel 
C(E, F), dite associée aux bases B et B’. En 
particulier, si E et F sont de dimension 
finie, il en est de même de C(E, F), et : 

dim C(E, F) = (dim E) . (dim F). 

(Notons que cette formule reste valable 
si E ou F est réduit à { 0 } .) 

Plus particulièrement encore, l’espace 
vectoriel des endomorphismes de E est de 
dimension finie, et : 

dim L:(E) = (dim E) 2 . 

Soit E un espace vectoriel sur K non 
réduit à {0}, et B = (e/)^ une base de E. 
Pour tout élément / de J, l’unique forme 
linéaire e* telle que, pour tout élément 
j de J : 

= bÿ 


s’appelle i-ième forme linéaire coordon- 
née. La famille (e*j)j £ j des formes linéaires 
coordonnées est libre ; pour que ce soit une 
base de E*, il faut et il suffit que E soit de 
dimension finie. Cette base s’appelle base 
duale de la base B, et se note B*. Nous 
voyons ainsi que l’espace vectoriel dual de 
E est de dimension finie si et seulement si 
E est de dimension finie, et que, dans ces 
conditions : 

dim E* = dim E. 

Corollaire 2. Pour que deux espaces 
vectoriels de dimension finie sur K soient 
isomorphes, il faut et il suffit qu’ils aient 
même dimension. 

Corollaire 3. Soit E un espace vectoriel 
de dimension finie n sur K, et S une partie 
génératrice finie de E. Alors le nombre p 
d’éléments de S est supérieur ou égal à n. 
De plus, il existe une partie basique de E 
constituée de Yl vecteurs convenablement 
choisis dans S. 

Corollaire 4. Soit E un espace vectoriel 
de dimension finie n sur K. Toute partie 
libre de E ayant Yl éléments est une partie 
basique de E, et toute partie génératrice de 
E ayant n éléments est une partie basique 
de E. 

Dimension et codimension 
d'un sous-espace vectoriel 

Soit E un espace vectoriel sur K. On dit 
qu’un sous-espace vectoriel E’ de E est de 
codimension finie dans E si l’espace vec- 
toriel quotient E/E' est de dimension finie. 
La dimension de E/E' s’appelle alors 
codimension de E’ dans E, et se note 
codim E E'. Les sous-espaces vectoriels de 
codimension 1 dans E s’appellent hyper- 
plans de E. 

Pour qu’un sous-espace vectoriel E’ de 
E soit de codimension finie dans E, il faut 
et il suffit que E’ admette un sous-espace 
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vectoriel supplémentaire de dimension 
finie. Alors, pour tout sous-espace vecto- 
riel E” supplémentaire de E’ dans E : 

dim E” = codim E E' = dim E/E'. 

Théorème IL Soit E et F deux espaces 
vectoriels sur K, et U une application 
linéaire de E dans F. 

1. Si F est de dimension finie et si U est 
injective, alors E est de dimension finie, et 
dim E dim F. En particulier, tout SOUS- 
espace vectoriel F’ d’un espace vectoriel F 
de dimension finie est aussi de dimension 
finie, et dim F’ ^ dim F. 

2. Si E est de dimension finie et si U est 
surjective, alors F est de dimension finie, 
et dim F dim E. En particulier, tout 
sous-espace vectoriel E’ d’un espace vec- 
toriel E de dimension finie est de codi- 
mension finie dans E, et : 

dim E/E' = codim E E' ^ dim E. 

Soit en effet B une partie basique de E, 
et B’ une partie basique de E’. 

Si U est injective, card(U(B)) = 
card(B), et U(B) est une partie libre 
de F. Il résulte du théorème 10 que 
card(U(B)) ^ card(B'). L’assertion 1 en 
découle, puisque F est de dimension finie. 
Le cas particulier s’en déduit en prenant 
pour E un sous-espace vectoriel F’ de F, et 
pour U l’injection canonique de F’ dans F. 

Si U est surjective, U(B) est une partie 
génératrice de F ; d’autre part, card 
(U(B)) ^ card(B). Il résulte du corollaire 
4 du théorème 10 que card(B') ^ 
card(U(B)). L’assertion 2 en découle, puis- 
que E est de dimension finie. Le cas 
particulier s’en déduit en prenant pour F 
l’espace vectoriel quotient E/E', et pour U 
l’application linéaire canonique de E 
sur E/E'. 

Corollaire. Soit E un espace vectoriel de 
dimension finie sur K, et E’ un sous -espace 


vectoriel de E. Alors la dimension de tous 
les sous-espaces vectoriels supplémentaires 
de E’ dans E est égale à dim E dim E’. 
De plus : 

codim E E' = dim E/E' = dim E — dim E’. 

En particulier, pour que E’ = E, il faut 
et il suffit que dim E’ = dim E. De même, 
les hyperplans d’un espace vectoriel de 
dimension n ne sont autres que les SOUS- 
espaces vectoriels de dimension n 1. 

Rang d'une application linéaire 

Soit E et F deux espaces vectoriels sur K, 
et U une application linéaire de E dans F. 
On dit que U est de rang fini si l’image de 
U est un espace vectoriel de dimension 
finie. La dimension de Im(U) s’appelle 
alors rang de l’application linéaire U, et se 
note rang(U). 

Théorème 12. Pour que l’application 
linéaire U soit de rang fini, il faut et il suffit 
que le noyau de U soit de codimension 
finie dans E. Le rang de U est alors égal à 
la codimension dans E du noyau de U : 

(1) rang(U) = dim Im(U) = codim, Ker(U) 

En effet, l’espace vectoriel quotient 
E/Ker(U) est isomorphe à l’espace vecto- 
riel Im(U). 

Si F est de dimension finie, toute 
application linéaire U de E dans F est de 
rang fini, car Im(U), étant un sous-espace 
vectoriel de F, est de dimension finie. 

Si E est de dimension finie, toute 
application linéaire U de E dans F est de 
dimension finie, et l’on a la formule de la 
dimension : 

(2) rang(U) = dim E — dim Ker(U). 

En effet, U définissant une application 
linéaire surjective de E sur Im(U), l’espace 
vectoriel Im(U) est de dimension finie. La 
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formule (2) est alors une conséquence de 
la formule (1) et de la suivante : 

codim, Ker(U) = dim E — dim Ker(U). 

Lorsque les espaces vectoriels E et F 
sont tous deux de dimension finie, et qu’ils 
ont même dimension n , il est équivalent de 
dire : 

L’application linéaire U est un isomor- 

phisme de E sur F ; 

L’application linéaire U est inversible à 

droite ; 

- L’application linéaire U est inversible à 
gauche ; 

L’application linéaire U est bijective ; 

- L’application linéaire U est surjective ; 

L’application linéaire U est injective ; 

- Le rang de U est égal à n. 

Dualité en dimension finie 

Théorème 13. Soit E un espace vectoriel de 
dimension finie sur K. Alors l’application 
linéaire canonique x de E dans son bidual 
E** est un isomorphisme. 

Soit en effet x un élément du noyau de X- 
Alors, pour toute forme linéaire y* sur E, 

<X(x),y*>= (y*,x)= 0. 

Choisissons une base B = (Cj ) j de 
E. En prenant successivement pour y* les 
n formes linéaires coordonnées e*, nous 
voyons que toutes les composantes de x 
sont milles, et donc que x = 0, ce qui 
montre que l’application linéaire x est 
injective. Comme : 

dim E** = dim E* — dim E, 

la formule de la dimension permet d’en 
déduire que x est un isomorphisme de E 
sur E**. 

Il découle de ce théorème que l’applica- 
tion qui à toute base B de E associe sa base 
duale B* est une bijection de l’ensemble des 
bases de E sur l’ensemble des bases de E*. 


On peut maintenant préciser les pro- 
priétés de l’orthogonalité en dimension 
finie. 

Théorème 14. Soit E un espace vectoriel 
de dimension finie sur K, et E* son dual. 
Pour tout sous-espace vectoriel F de E : 

(1) dim F + dim F 1 = dim E. 

Pour tout sous-espace vectoriel G de E* : 

(2) dim G + dim G’ — dim E. 

De plus : 

(3 ) (F 1 )' = F et (G y= G. 

Considérons en effet une base (<?j, Ép, .... 
e„) de F, et complétons-la en une base (^j, 
é? 2 î • • • • e„) de E ; soit (ej, e 2 , ... . e* n ) sa base 
duale. Pour établir la formule (1), il suffit 
de prouver que (e*_|_|, ^* 4 - 2 » • • • • C* n ) est une 
base de F 1 . Les formes linéaires coordon- 
nées <?*+,, <?* +2 , ••• appartiennent 
évidemment à F 1 , car elles sont orthogo- 
nales aux vecteurs CS, . . . . e p , lesquels 
engendrent F ; elles sont linéairement indé- 
pendantes, car elles font partie d’une base ; 
enfin, il reste à montrer que tout élément 
y* de F 1 est combinaison linéaire de ces 
éléments. Ecrivons pour cela y* sous la 
forme : 


n 



/= 1 


Puisque, pour tout élément i de [ 1, /?], 
<y*, e,> = 0, nous voyons que 
î]j = rp = ... = r\ p — 0, ce qui achève la 
démonstration. La formule (2) s’établit de 
manière analogue, en tenant compte du 
fait que toute base de E* est la base duale 
d’une base de E. Enfin, la formule (3) se 
déduit des relations F C (F 1 )', G C (G') X , 
dim F = dim(F 1 )' et dim G — dim(G') 1 , 
ces deux dernières égalités découlant des 
formules (1) et (2). 
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Théorème 15. Soit E et F deux espaces 
vectoriels de dimension finie sur K, soit U 
une application linéaire de E dans F, et ‘U 
sa transposée. 

Les applications linéaires U et ‘U ont 
même rang : 

rang(U) = rang( r U). 

En effet, la formule de la dimension 
appliquée à 'U montre que : 

rang( r U) = dim F* — dim Ker( f U) 

— dim F — dim Ker( ( U). 

D’autre part : 

rang(U) = dii Im(U) = dim F — dimjdmfU)] 1 . 

La formule annoncée résulte alors du 
fait que le noyau de 'U n’est autre que 
l’orthogonal de l’image de U. 


5. Matrices 

Matrices et applications linéaires 

Soit E et F deux espaces vectoriels sur K 
non réduits à {0}, de dimensions respec- 
tives p et n, soit B = (e^ e 2 , e p ) une 

base de E, soit B’ = (f u /%, • • • • f n ) une 
base de F et U une application linéaire de 
E dans F. Pour tout élémentj de [1, /?], le 
vecteur U(e,) se décompose d’une manière 
et d’une seule dans la base B’ sous la 
forme : 

n 

(1) U(«y) 

1 = l 

Ainsi, à toute application linéaire U de 
E dans F nous pouvons associer une 
famille (a,y) d’éléments de K. Réciproque- 
ment, pour toute famille (a,) d’éléments de 
K, où (ij) E [1, n] X [1, p\, il existe une 
application linéaire U et une seule de E 
dans F satisfaisant aux conditions (1). 


Nous sommes donc amené à introduire 
les définitions suivantes, utiles pour les 
calculs explicites concernant les applica- 
tions linéaires : Soit K un corps COïïimU- 
tatif, ÏI et p deux entiers naturels non nuis. 
On appelle matrice à n lignes et p colonnes 
à éléments dans K toute famille : 

M = [ 1 , n] X[\,p] 

d’éléments de K. Il est d’usage de disposer 
les éléments d’une matrice dans les cases 
d’un tableau rectangulaire à n lignes et p 
colonnes, encadré de deux parenthèses (ou 
parfois de deux crochets) : 


a n o-n * ■ 

*«1 j" 

■ a i P 

a 2 i a„ 

«2 j 

«2 p 

«/i a /2 

a ij 

«/p 

a n2 

a. 

a np 


L’indice i s’appelle indice de ligne, 
l’indice j, indice de colonne. Pour tout 
élément i de [1, n ], la suite (°b/)i 
s’appelle i-ième ligne de M; pour tout 
élément j de [1 ,p], la suite 
s’appelle j-ième colonne de M. 

Le vecteur de K /; dont les composantes 
constituent la i-ième ligne de M s’appelle 
i-ième ligne de M ; le vecteur de K" dont les 
composantes constituent la j-ième colonne 
de M s’appellej-ièmevecteur colonne de M. 

Lorsque n = 1, on dit que M est une 
matrice ligne ; lorsque p = 1, on dit que M 
est une matrice colonne. 

L’ensemble des matrices à n lignes et p 
colonnes à éléments dans K, se note 
M„,(K). Lorsque n = p, on dit que A4 est 
une matrice carrée d’ordre n. L’ensemble 
des matrices carrées d’ordre n à éléments 
dans K se note M,(K). 

Soit, plus généralement, A, I et J trois 
ensembles, I et J étant finis. On appelle 
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matrice de type (I, J) à éléments dans A 
toute famille : 

M=(a,,), (i.yJGIX J 

d’éléments de A. Lorsque 1, ou J, est vide, 
on dit que M est la matrice vide. 

Reprenons maintenant le problème ini- 
tial : la matrice M = (a ;y ) définie par la 
formule (1) est dite associée à l’application 
linéaire U dans les bases B et B’, et notée 
A/ B b'(U). La matrice M a pour j-ième 
colonne la famille des composantes dans la 
base B’ de l’image par U du y-ième vecteur 
de la base B. L’application qui à toute 
application linéaire U de E dans F associe 
la matrice M B B (U) est une bijection de 
C(E, F) sur M„ ; ,(K). 

En particulier, lorsque E = F, U est un 
endomorphisme de E. La matrice M B B ’(U) 
est une matrice carrée, appelée matrice 
associée à l’endomorphisme U dans la 
base B, et notée plus simplement A/ B (U). 

Toute matrice peut être considérée 
comme une matrice associée à une appli- 
cation linéaire : pour tout élément M de 
M„„(K), il existe une application linéaire 
et une seule de l’espace vectoriel K 77 dans 
l’espace vectoriel K' 1 dont la matrice asso- 
ciée dans les bases canoniques de ces 
espaces vectoriels soit M. Cette application 
linéaire s’appelle application linéaire de Kf 
dans K" canoniquement associée a M. 

Opérations sur les matrices 

La bijection canonique cp de M,,„,(K) sur 
L(K /? , K 71 ) ainsi introduite conduit aux 
définitions qui suivent. 

Somme de deux matrices. On appelle 
somme de deux éléments M = (a,y) et 
M’ = (a’,,) de M, k/ 7 (K), et on note 
M + Af , l’élément ((3,y) de M, f/ ,(K) défini 
par les relations : 

Pÿ = a „ + a ’„ 


Produit d’une matrice pur un scalaire . 
On appelle produit d’un élément A4 = (a ,y) 
de M /2/? (K) par un scalaire À, et on note 
AM, l’élément ( (3 ; y ) de M„ /; (K) défini par les 
relations : 

h = 

Muni de ces deux lois, l’ensemble 
M /Î/; (K) est un espace vectoriel de dimen- 
sion np sur K, et cp est un isomorphisme de 
l’espace vectoriel M, t/? (K) sur l’espace 
vectoriel £(K /; , K"). 

Plus généralement, soit E et F deux espa- 
ces vectoriels sur K, de dimensions respec- 
tives p et n , soit B une base de E, et B’ une 
base de F. La bijection U h ~* M B B '( U) est un 
isomorphisme de l’espace vectoriel L(E, F) 
sur l’espace vectoriel M,^(K). 

Produit de deux matrices. Soit m, n et p 
trois entiers naturels non nuis, soit 
M = (OLjj) un élément de M,,,,,(K), et 
N = (P /f/ ) un élément de M,,„„(K). On 
appelle produit des matrices Met N, et on 
note NM, l’élément (y /2/ ) de M„„„(K) défini 
par les relations : 

n 

Ihj = ^ P*, «y 

frf 

On obtient donc l’élément y hj à l’intersec- 
tion de la /7-ième ligne et de la y-ième colonne 
de NM en prenant la h-ième ligne de N, la 
j-ième colonne de A/, et en ajoutant les pro- 
duits des éléments de même indice (règle de 
multiplication « ligne par colonne »). 

Grâce à la bijection canonique de 
M, V (K) sur C(K/\ K 7 '), on voit aussitôt 
que, pour tout couple (M, M’) d’éléments 
de M,„„(K), pour tout couple (N, N’) 
d’éléments de M„„„(K) et pour tout couple 
(A, p) de scalaires : 

(N + N')M = NM + N’M, 

N(M + M') - NM + NM\ 

(jj N)(XM) = (mà)AM. 
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Pour tout élément M de M /Î/? (K), pour 
tout élément N de M„„„(K) et pour tout 
élément P de M,„„(K), 

(PN)M = P(I\IM). 

Soit enfin E, F et G trois espaces 
vectoriels sur K, de dimensions respectives 
p, n et m, soit B une base de E, soit B’ une 
base de F, et B” une base de G. Pour toute 
application linéaire U de E dans F et pour 
toute application linéaire V de F dans G : 

M B p(VoXJ)=M V r(y).M v (!J). 

Algèbre des matrices carrées d'ordre n. 
Muni des trois opérations précédentes, 
l’ensemble M„(K) est une algèbre associa- 
tive unitaire. F’ élément unité est la matrice : 

h = (5 i} ). 

Soit E un espace vectoriel sur K, et B 
une base de E. F’ application U * À/ B (U) 
est un isomorphisme de l’algèbre unitaire 
Ç_(E) sur l’algèbre unitaire M„(K). Dans 
cet isomorphisme, le groupe linéaire 
GF(E) a pour image le groupe, noté 
GL„(K), ou encore GL (n, K), des matri- 
ces carrées d’ordre n inversibles. En par- 
ticulier, si U est un automorphisme de E, 
M b (U) admet pour inverse la matrice 
associée à U - 1 dans la base B : 

Transposée d'une matrice. Soit M un 
élément de M, î/; ( K). On appelle transposée 
de M, et on note { M, l’élément de M„„(K) 
dont les colonnes sont les lignes de M . 

Soit U l’application linéaire de K/* dans 
K n canoniquement associée à M ; alors 
n’est autre que la matrice associée à 'U 
dans les bases canoniques de (K /? )* et de 
(K^)*. Par suite, l’application l M est 

un isomorphisme de l’espace vectoriel 
sur l’espace vectoriel M /?/J (K). 


Pour tout élément M de M„^(K) et pour 
tout élément N de M„„(K) : 

f (NM)=‘M'N 

Pour tout élément M de M„ /> (K) : 

‘ ( ‘ M ) = M . 

Soit enfin E et F deux espaces vectoriels 
sur K, de dimensions respectives p et n, 
soit B une base de E et B’ une base de F, 
soit B* et B’* leurs bases duales. Pour toute 
application linéaire U de E dans F : 

= B,B' (U)' 

Changement de base 

Soit E un espace vectoriel de dimension p 

sur K. Considérons deux bases de E : 

B l =(e u e li . . .,e p % 

B 2 = (e' u e' 2 ,....e' p ), 

appelées respectivement ancienne et nou- 
velle base. Pour tout élément j de [ 1, p], le 
vecteur e'j se décompose dans la base Bj 
sous la forme : 

a ij e i’ 

i « I 

L’élément P = (a ;/ ) de M„(K) s’appelle 
matrice de passage de la base Bj à la base 
Bi ; ses colonnes sont constituées des 
composantes dans l’ancienne base des 
nouveaux vecteurs de base. La matrice P 
n’est autre que la matrice Ï E ) asso- 

ciée à l’application identique de E dans les 
bases B 2 et Bj. Il s’ensuit que la matrice P 
est inversible, et que la matrice de passage 
de B 2 à B t n’est autre que P~^ . 

Soit E et F deux espaces vectoriels non 
réduits à {0} de dimension finie sur K. soit 
B, et B 2 deux bases de E et B ] et B 2 deux 
bases de F, soit P la matrice de passage de 
B, à B^> et Q la matrice de passage de B'[ 
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à B\. Pour toute application linéaire U de 
E dans F, les matrices associées à U dans 
les bases B, et B’„ d’une part, et dans les 
bases B 2 et B' 2 , d’autre part, sont liées par 
la relation : 

Mb 2 ,b 2 (U) = Q-'m^wp 

En particulier, pour tout endomor- 
phisme U de E : 

^b 2 (U) = P~ l M hl (\J)P . 

Rang d'une matrice 

Soit M un élément de On appelle 

rang de la matrice M, et on note rang(M) 
le rang de l’application linéaire de dans 
K /? canoniquement associée à M. 

Plus généralement, soit E et F deux 
espaces vectoriels de dimension finie sur K 
non réduits à {0}, soit B une base de E et 
B’ une base de F. Pour toute application 
linéaire U de E dans F : 

rang M B B ' (U) = rang(U). 

De la relation entre le rang d’une 
application linéaire et celui de sa transpo- 
sée, on déduit aussitôt que, pour tout 
élément A4 de M n/? (K) : 

rang(M) = rang('Af). 

Il en découle que le rang de M est égal 
au rang de ses vecteurs colonnes, ou 
encore au rang de ses vecteurs lignes. 

Les caractérisations des applications 
linéaires inversibles conduisent à des 
caractérisations des matrices carrées inver- 
sibles. 

Soit A4 un élément de M„(K). Il est 
équivalent de dire : 

La matrice A4 est inversible ; 

- La matrice M est inversible à droite ; 

La matrice A4 est inversible à gauche ; 

- La matrice ‘A4 est inversible ; 

Le rang de M est égal à n ; 


- Le rang des vecteurs colonnes de M est 
égal à n ; 

Le rang des vecteurs lignes de M est égal 
à n. 

Matrices équivalentes 

Soit M\ et M 2 deux éléments de M,„„(K). 
On dit que les matrices M x et M~> sont 
équivalentes s’il existe deux matrices car- 
rées inversibles P et Q d’ordres respectifs 
p et n sl éléments dans K telles que : 

M 2 = QM X P. 

Soit Y un entier naturel. Pour qu’une 
matrice Mde M, Î/; (K) soit de rang Y, il faut 
et il suffit que M soit équivalente à la 
matrice J r = (a,y), où (Xÿ = 1 si / G / 1 , Y] et 
où a y = 0 dans les autres cas. 

Il en découle qu’une condition néces- 
saire et suffisante pour que deux éléments 
de M„/K) soient équivalents est qu’ils 
aient même rang. 

On appelle opérations élémentaires les 
applications M'—'Af de M n/) (K) dans 
lui-même de l’un des types suivants : 

(a) La matrice M se déduit de la matrice 
M par permutation de deux colonnes, ou 
de deux lignes. 

(b) La matrice M se déduit de la matrice 
M par multiplication d’une colonne, ou 
d’une ligne, par un scalaire non nul. 

(c) La matrice M' se déduit de la matrice 
M par addition à un vecteur colonne (resp. 
à un vecteur ligne) du produit d’un autre 
vecteur colonne (resp. d’un autre vecteur 
ligne) par un scalaire. 

Pour que deux matrices M , et M 2 soient 
équivalentes, il faut et il suffit que l’on 
puisse transformer M, en M 2 par une suite 
finie d’opérations élémentaires. 

La théorie des opérations élémentaires 
permet en outre de calculer le rang d’une 
matrice, son déterminant et, lorsqu’elle 
existe, la matrice inverse. 
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Systèmes d'équations linéaires 

Soit H et p deux entiers naturels non nuis, 
U une application linéaire de K/ dans 
et M = (a,) la matrice associée, soit fl 2 , 

. ... a p les vecteurs colonnes de cette matrice 
et a’„ a’ 2 , .... Cl’ n ses vecteurs lignes, soit 
enfin b = (P/)i un élément de K". On 
désigne par x = (ty)j ^ un élément de 
K”. L’équation U(x) = b équivaut au sys- 
tème de n équations linéaires àp inconnues 
suivant : 

^ ®ll£l + ^12^2 + 

+ Uijtj + . . . + Q-ipip = Pi 
a 21^1 + a 22^2 + 

♦ a 2 jij + + a lp i p - |3 2 


+ a /2^2 + 

+ Ot ij^>j + + Of/pCp — P / 


a /il?l + a n2^2 + 

+ ®nfij + + = P « 


La résolution de ce système peut s’inter- 
préter vectoriellement comme la recherche 
des suites (£ l} £ 2 » • • • • t p ) de scalaires telles 
que : 

+ t 2 a 2 + + ijd j + + l p a p = b, 

ou encore comme la recherche des vec- 
teurs x de K/ tels que : 

f (a\*,x) = pj 

( a’ 2 *,x > = p 2 

(a Wx) =Pi 

L b'n*,X> = P, 

c’est-à-dire des vecteurs x sur lesquels les 
formes linéaires a\*,a 2 *, • • • • Cl’ n * prennent 
des valeurs données (3j, (3 2 , • • • • P, r 

On appelle rung de ce système le rang 
de M, c’est-à-dire le rang de U. En 
appliquant les propriétés du rang des 


matrices, on obtient les résultats sui- 
vants : 

Unicité des solutions. Il est équivalent de 
dire : 

- Pour tout élément b de K/ 1 , l’équation 
U(x) = b a au plus une solution ; 

- Les vecteurs colonnes a,, û 2 » • • • • a p sont 
linéairement indépendants dans K” ; 

Les vecteurs lignes a\*, a’*, - - - - a’ * 
engendrent (K/)* ; 

Le rang r de M est égal à p. 

Existence des solutions quel que soit le 
second membre. Il est équivalent de dire : 

- Pour tout élément b de K”, l’équation 
U(x) a au moins une solution ; 

Les vecteurs colonnes a,, a^, ... . a p 
engendrent K' 1 ; 

Les vecteurs lignes a',*, a * , .... a' * sont 
linéairement indépendants dans (K/)* ; 

Le rang r de M est égal à n. 

Existence d’une solution, le second mem- 
bre étant donné. Soit b un élément de K". 
Il est équivalent de dire : 

L’équation U(x) = b a au moins une 
solution ; 

- Le second membre b appartient au 
sous-espace vectoriel de K" engendré par 
a x ,a 2 ,..,,a p \ 

Le second membre b est orthogonal à 

Ker(OJ) ; 

- Toute relation linéaire vérifiée par les 
vecteurs lignes l’est aussi par les compo- 
santes de b. 


6. Applications multilinéaires 
Définitions 

Soitp un entier naturel non nul, soit E„ E ? , 
et F des espaces vectoriels sur K. On 
dit qu’une application S de E, X E 2 X 
X E^ dans F est multilinéaire, si, pour 
tout élément j de [1, p ] 5 toute application 
partielle S, de Ey dans F est linéaire. 
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Lorsque F := K, on dit que S est une forme 
multilinéaire. 

Soit E un espace vectoriel sur K. Les 
applications multilinéaires de E p dans F 
s’appellent applications p-linéaires sur E à 
valeurs dans F, et les formes multilinéaires, 
formes p-linéaires. 

Voici quelques cas particuliers : 

Soit S une application p-linéaire sur E à 
valeurs dans F. On dit que S est alternée si, 
pour toute suite (xj, x 2 , .... x p ) de vecteurs 
de E contenant deux vecteurs égaux : 

S ( x ,,* 2 = 0 . 

On dit que S est symétrique si, pour 
toute permutation Q de [ 1 , p] et pour toute 
suite (jCj, *2, .... x,,) de vecteurs de E : 

S(* 0(1) . * «2) *<*>)= SC* 1 . * 1 

On dit que S est antisymétrique si, dans 
les mêmes conditions : 

SC* o(l) - * o(2) . *<*,)) = E(CT)S(JC , , JC 2 X p ), 

où e(ct) désigne la signature de la permu- 
tation a. 

Toute application p-linéaire alternée est 
antisymétrique ; la réciproque devient 
vraie si la caractéristique du corps K est 
différente de 2. 

Pour qu’une application p-linéaire S 
soit alternée, il faut et il suffit que, pour 
toute suite (x b x 2 , . . . . x p ) de vecteurs de E 
contenant deux vecteurs consécutifs x, et 
x i+] égaux : 

S(*i,* 2 > — x p ) = 0. 

Si S est alternée, on ne change pas la 
valeur de S sur une suite de p vecteurs de 
E en ajoutant à l’un de ces vecteurs une 
combinaison linéaire des autres. En parti- 
culier, si l’un des vecteurs A'j, X 2 , . . . . x p est 
une combinaison linéaire des autres, S(Xj, 
* 2 . > X p ) = 0 . 


Les applications p-linéaires sur E à 
valeurs dans F constituent un sous-espace 
vectoriel, noté JAj p { E, F), de l’espace vec- 
toriel 5*(E^, F) des applications de W dans 
F. Lorsque p = 1, «X^(E, F) n’est autre 
que C(E, F). Les applications p-linéaires 
symétriques et les applications p-linéaires 
alternées constituent des sous-espaces vec- 
toriels de Jt p (E, F), notés respectivement 
S / ,(E, F) et A p (E, F). Enfin, lorsque F 
= K, ces divers espaces vectoriels se 
notent plus simplement Jb ; ,(E), S,(E) et 
^(E). 

Extension d’une application linéaire 

Voici une généralisation de la transpo- 
sition : Soit E, E’ et F trois espaces 
vectoriels sur K, et U une application 
linéaire de E’ dans E. Pour toute appli- 
cation p-linéaire S sur E à valeurs dans F, 
l’application de E' p dans F définie par 
la formule : 

Su(*i>*2> •••>•*,) = S(U(;c,), U(x 2 ), U(x,)) 

est une application p-linéaire sur E’ à 
valeurs dans F. L’application U /? qui à tout 
élément S de A^E, F) associe Sy est une 
application linéaire de .X^(E, F) dans 
JLp( E', F), et l’image de de S ;; (E, F) 
(resp. de A p ( E, F)) est contenue dans 
S /) (E', F) (resp. dans A p (E\ F)). Soit enfin 
E” un espace vectoriel sur K, et V une 
application linéaire de E” dans E’. Alors : 

(VoU), -U,oV,. 

Lorsque U est l’homothétie de rapport 
a dans l’espace vectoriel E, l’application 
n’est autre que I’homothétie de rapport 
OP dans l’espace vectoriel «X^E, F). 

Voici maintenant une méthode générale 
de construction d’applications p-linéaires 
symétriques, ou alternées : Pour toute 
application p-linéaire S de E dans F, les 
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M(S){X U X 2 , 

A(S){x u x 2 , 


p ) — S(x 0(1) , X 0(2) j 


oGZp 


X p ) 




= ^ ^(d)S(x 0 (j) , x 0 ( 2 ) > 

oG Zp 


o(p))> 


où L p désigne le groupe symétrique de 
degré /?, sont respectivement symétrique et 
alternée. De plus, l’application M : 
S-M(S) de X/^E, F) dans cS^E, F) est 
linéaire, et l’application A : S-A(S) de 
X/E, F) dans A p ( E, F) est linéaire ; elles 
se dénomment opérateurs de symétrisation 
et d’antisymétrisation. 


Formes multilinéaires 

Lorsque F = K, nous allons étudier la 
structure de X ; ,(E), de S,(E) et de „4 /; (E). 

Nous allons d’abord construire des 
formes p-linéaires à l’aide de formes linéai- 
res. 

Soit (y*, y 2 , , y* p ) une suite de p formes 
linéaires sur E. L’application /de E^ dans 
K définie par la formule : 

/( x u x 2 ,...,x p ) = <y$,x 2 > (y},x p ) 

est une forme p-linéaire sur E, appelée 
produit tensoriel des formes linéaires yq, 

y 2 , y* et notée y\ ® y 2 ® ®yj r Les 

applications M(/ ) et A (/'), symétrisée et 
antisymétrisée de f s’appellent respective- 
ment produit symétrique et produit exté- 
rieur des formes linéaires yq, y 2 , )* p et 

se notent y* • yy •y* et 

)*\ A y 2 A A y;,. 

L’application qui à (y b }’?, .... }* p ) 
associe y* 0 y* 0 0 y* (resp. y* . yy ■ 
•y/ resp. yq A y* A A y*) est une 
application y-linéaire (resp. p-linéaire 
symétrique, resp. p-linéaire alternée) de 


(E *Y dans X/E) (resp. dans S,(E), resp. 
dans “t,,(E)). 

On dit qu’une forme p-linéaire S est un 
élément décomposable de X/E) (resp. de 
S,(E), resp. de A/E)) s’il existe une suite 
(yj, y 2 , y*) de p formes linéaires sur E 

dont le produit tensoriel (resp. symétrique, 
resp. extérieur) est égal à S. 

Il reste à montrer que toutes les formes 
p-linéaires peuvent être reconstituées à 
l’aide des éléments décomposables lorsque 
l’espace vectoriel E est de dimension finie, 
ce qui fait l’objet du théorème fondamental 
suivant. 

Théorème 16. Soit B = (*q, e 2 , . . . . e n ) 
une base de E, et B* = (e* 9 e* 2 , .... e* n ) la 
base duale de B. 

1. Soit T l’ensemble des applications de 
[ 1 , /?] dans [1, h], et, pour tout élément JC 
de .T, e y l’élément de X/E) défini par la 
formule : 


*0) 


x(pï 


Alors la famille (/ x ) x e 7 est une basse 
de X/E), dite canoniquement associée à 
B. Par suite, la dimension de X/E) est 
égale à n p , et les formes p-linéaires décom- 
posables constituent une partie génératrice 
de cet espace vectoriel. En particulier, 
l’espace vectoriel des formes bilinéaires sur 
E est de dimension n 2 . 

2. Soit S l’ensemble des applications S 
de [ 1, n] dans N telles que : 


n 



et, pour tout éléments de S, e s l’élément de 
S„(E) défini par la formule : 


= n e f ) - 

» 

Alors, si K est de caractéristique 0, la 
famille {e s ) s ^ $ est une base de S /; (E), dite 
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canoniquement associée à B. Par suite, la 
dimension de S„(E) est égale à et les 

formesp-linéaires symétriques décomposâ- 
mes constituent une partie génératrice de 
cet espace vectoriel. En particulier, l’espace 
vectoriel des formes bilinéaires symétri- 
ques sur E est de dimension n(lî -f- l)/2. 

3. Lorsquep > n , .^(E) = {0}. Dans 
le cas contraire, soit F l’ensemble des 
parties de [ 1 , n] à p éléments, et, pour tout 
élément P de 0 1 , e p l’élément de ^(E) 
défini par la formule : 

ep = ^<p(l) A £ <p(2) A ...A € q^p) } 

où <p désigne l’application strictement 
croissante de [ 1, p] dans [ 1, n] ayant P pour 
image. Alors la famille (e p ) p&r est une base 
de -t,(E), dite canoniquement associée à 
B. Par suite, la dimension de Æ p (E) est 
égale à Ci;, et les formes p-linéaires alter- 
nées décomposables constituent une partie 
génératrice de cet espace vectoriel. En 
particulier, l’espace vectoriel des formes 
bilinéaires alternées sur E est de dimension 
n(n — l)/2. 

Enfin, comme C" = 1, l’espace vecto- 
riel des formes n-linéaires alternées sur E 
est de dimension 1, résultat dont l’impor- 
tance va apparaître dans la théorie des 
déterminants. 

En utilisant la structure de A^(E), on 
établit facilement les deux critères d’indé- 
pendance linéaire suivants, très utiles en 
pratique. 

Soit E un espace vectoriel de dimen- 
sion n sur K, etp un entier inférieur ou égal 
à n. Pour qu’une suite (jt b jc 2 , .... x p ) de 
vecteurs de E soit libre, il faut et il suffit 
qu’il existe un élément / de A,(E) tel que 
/(*,. *2> •••> X P ) ^ °- De même, pour 
qu‘une suite (y l9 y 29 ... . Jp) de formes 
linéaires sur E soit libre, il faut et il suffit 
que y\ A }h A A y p ^ 0. 


7. Déterminants 

Déterminant de n vecteurs 
Soit E un espace vectoriel de dimension n 
sur K, et B = (e { , e 2 , . . . . e,) une base de E. 
La base de Æ W (E) canoniquement associée 
à B est réduite à la forme n-linéaire alternée 
e* A e\ A A e* n ; celle-ci est la seule 
forme n-linéaire alternée sur E prenant la 
valeur 1 sur (*»,, e 2 , . . . . e,). On l’appelle 
déterminant dans la base B, et on la note 
det B . Pour tout élémentfde A H (E) et pour 
toute suite (X|, .... x,) de vecteurs de E : 

(x u x 2 ,...,x n ) 

Les propriétés des formes n-linéaires 
alternées s’appliquent à det B . De plus, le 
critère d’indépendance linéaire de n vec- 
teurs s’énonce ici : pour que (.xq, X 2 , • . . . X fl ) 
soit libre, il faut et il suffit que det B (Xj, X 2 , 

x n) ¥* 0 . 

Déterminant d’un endomorphisme 
Soit E un espace vectoriel de dimension n 
sur K. Puisque ^(E) est de dimension 1, 
tout endomorphisme de A,(E) est une 
homothétie. En particulier, pour tout 
endomorphisme U de E, l’extension U„ de 
U à l’espace vectoriel A fl (E) est une 
homothétie ; le rapport de cette homothé- 
tie s’appelle déterminant de l’endomor- 
phisme U, et se note det U. Ainsi, par 
définition de det U, pour tout élémentfde 

A„(E) : 

[U(*,),U(* 2 ) U(x„)] 

= (det U) ,f{x i,x 2 , 

Des propriétés des extensions des appli- 
cations linéaires on déduit les résultats 
suivants : 

Pour tout couple (U, V) d’endomorphis- 
mes de E : 

det VU = (det V) . (det U). 
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Le déterminant de l’application identi- 
que de E est égal à 1 ; plus généralement, 
le déterminant de l’homothétie de rapport 
a est égal à a' 1 . 

Pour qu’un endomorphisme U de E soit 
inversible, il faut et il suffit que son 
déterminant soit non nul ; dans ces condi- 
tions : 


detU-> = -L-. 

detU 

Le déterminant du transposé 'U d’un 
endomorphisme U de E est égal à celui 
de U : 


det'U = det U. 

L’application U >— ► det U est donc un 
morphisme du groupe linéaire GL(E) dans 
le groupe multiplicatif K*. Le noyau de ce 
morphisme est un sous-groupe distingué 
de GL(E), appelé groupe spécial linéaire de 
E, et noté SL(E). 

Déterminant d'une matrice carrée 

On appelle déterminant d’un élément A4 
de M,(K), et on note det Mie déterminant 
de l’endomorphisme de K„ canonique- 
ment associé à M. Les propriétés du 
déterminant d’un endomorphisme se 
transcrivent aussitôt pour les matrices. De 
plus, le déterminant de M n’est autre 
que le déterminant de ses vecteurs colon- 
nes, ou de ses vecteurs lignes, dans la 
base canonique de K". Enfin, les matrices 
de déterminant 1 constituent un SOUS- 
groupe distingué de GL„(K), noté 

SL„(K). 

En utilisant la caractérisation du déter- 
minant de fi vecteurs, on démontre la 
proposition suivante : soit n et p deux 
entiers naturels non nuis tels que p < n, 
soit A un élément de soit B un 

élément de M„ ^(K), soit C un élément de 


M /V1 /? (K), et Ml’élément de M„(K) défini 
par la formule : 



Alors : 


det M = (det A ) . (det B ). 


On peut en déduire la formule de 
développement d’un déterminant suivant 
une colonne, ou une ligne. Considérons 
pour cela un élément M = (a„) de M„(K), 
où n > 1 ; pour tout couple (i, j) d’élé- 
ments de [ 1, w], notons A, la matrice carrée 
d’ordre n — 1 obtenue en supprimant la 
i-ième ligne et la y-ième colonne de M. 
Alors, pour tout élément / de [1, n] : 


n 

det M = ( - îy+'ciy det A u . 

ir . rl 


On est ainsi amené à considérer la 
matrice AT dont les éléments 0(L sont 
définis par la relation : 

a' ij = ( - 1 )' +j det A - tj . 

La transposée de M' s’appelle matrice 
complémentaire de M , et se note M. Il en 
découle immédiatement que : 


MM — M M = (det M)I n 
En particulier, lorsque Mest inversible : 


Af— 1 


1 

det M 


M, 


formule dont le principal intérêt est de 
montrer que l’application M M~ 1 est 
rationnelle. 


8. Produits tensoriels 

Produit tensoriel d'espaces vectoriels 

La notion de produit tensoriel sert a rempla- 
cer l’étude des applications multinéaires 
par celle des applications linéaires. Plus pré- 
cisément, on obtient le résultat suivant. 
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Théorème 17. Soit Ej, E 2 , . . . . E p des 
espaces vectoriels sur K. Il existe un couple 
(G, T) constitué d’un espace vectoriel G sur 
K et d’une application multilinéaire T de 
E, X E 2 X M . X E p dans Ci possédant la 
propriété universelle suivante : Pour tout 
couple (F, S) constitué d’un espace vecto- 
riel F sur K et d’une application multili- 
néaire S de E, X E 2 X X E^ dans F, il 
existe une application linéaire S et une seule 
de G dans F telle que S = S o T. Un tel 
couple (G, T) est unique à isomorphisme 
près. L’espace vectoriel G s’appelleproduit 
tensoriel des espaces vectoriels E j , E 2 , . . . . 
E et se note Ej 0 E 2 ® ® E /r L’appli- 
cation multilinéaire T se note : 

(x u x 2 , ... J x p )^x i (2) ®x p . 

L’application S l_ * S est un isomor- 
phisme de l’espace vectoriel A>(Ej X E 2 
X X E^, F) des applications multilinéai- 
res de E, X E 2 X X E^ dans F sur 
l’espace vectoriel C(E, ® E 2 ® 0 E^, F). 
Les éléments de E, 0 E 2 ® 0 E^ de la 
forme Xy 0 jv; 2 ® 0 x p sont dits décompo- 
sables ; ils constituent une partie généra- 
trice de E, 0 E 2 0 ... 0 E^. Si, pour tout élé- 
mentjde [ 1 ,p], E, est de dimension finie rij et 
est muni d’une base B, = (tfÿ), alors les élé- 
ments e ; 10 e, -> 0 ... 0 e, constituent une 

i].i \ 2 .i i^p 

base de E, 0 E 2 0 0 E^, dite canonique- 
ment associée aux bases B,. En particulier : 

dim Ej ® E 2 ® ... ® = n ! n 2 ••• n P • 

Soit maintenant (E„ E?, .... E,,) et (Fj, 
F-), . . . . F„) deux suites d’espaces vectoriels 
sur K, et, pour tout élément j de [1, p] 9 U, 
un élément de C(E„ F,). Il existe alors une 
application linéaire U et une seule de Ej 0 
E-> 0 . . . 0 E n dans F, ® F 2 0 0 F n telle 
que, pour tout élément (jCj, X 2 , X p ) de E! 
0 E 2 ® ... 0 E,, : 

U(xj ® x 2 ® ... ® x p ) 

= U ,(*,) ® U 2 (* 2 ) ® 0 U p (x p ). 


On l’appelle produit tensoriel des appli- 
cations linéaires U„ et on la note U, ® U 2 
® 0 u,. 

Trace d'un endomorphisme 

Soit E et F deux espaces vectoriels sur K. 
Pour tout élément (a*, b) de E* X F, 
l’application U„* h qui à tout vecteur x de 
E associe le vecteur < a*, X > b de F est 
une application linéaire de E dans F ; on 
l’appelle application linéaire élémentaire 
associée à (a*, h). Si a * et b ne sont pas 
nuis, l’image de U,,* /, est la droite K6 de F, 
et son noyau est l’hyperplan de E noyau de 
la forme linéaire a*. De plus, l’application 
(a*, b) ► U„* fy est une application bili- 
néaire de E* X F dans C(E, F). 

Il existe une application linéairej et une 
seule de E* 0 F dans C(E, F) telle que, pour 
tout élément (y* 9 z) de E* X F : 

j(y* ® = Uy* 2 - 

En effet, l’application (j ? *, z) ► U v * r est 
une application bilinéaire de E* X F dans 
C(E, F). La propriété universelle du pro- 
duit tensoriel E* 0 F montre alors l’exis- 
tence et l’unicité de j. 

De plus, si E et F sont de dimension 
finie, j est un isomorphisme, car j est 

injective et que : 

dim E* ® F = (dim E*) . (dim F). 

Soit enfin E un espace vectoriel sur K. 
11 existe une forme linéaire c et une seule 
sur l’espace vectoriel E* 0 E telle que, pour 
tout élément (y* , ,v) de E* X E : 

c(y * ® x) = 

L’application c s’appelle contraction 

canonique de E* 0 E dans K. 

En effet, l’application (j’*, X) 

<}•’*, x > est une application bilinéaire de 
E* X E dans K. La propriété universelle 
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du produit tensoriel E* (x) E prouve l’exis- 
tence et l’unicité de c. 

En combinant les résultats précédents, 
nous obtenons le théorème qui suit. 

Théorème 18. Soit E un espace vectoriel 
de dimension finie sur K. Il existe une 
forme linéaire et une seule sur l’espace 
vectoriel L(E), appelée trace et notée tr, 
telle que, pour tout endomorphisme élé- 
mentaire de E, 

tr U aV = <û *,b). 

Cette forme linéaire n’est autre que 
coj~\ où j désigne l’isomorphisme cano- 
nique de E* ® E sur C(E). 

De plus, la trace possède les propriétés 
suivantes : 

- Pour tout couple (U, V) d’endomorphis- 
mes de E : 

tr(VU) = tr(UV). 

Pour tout endomorphisme U de E : 
tr'U = trU. 

Enfin, on définit la trace d’un élément 
A4 = (otÿ) de M„(K) comme la trace de 
l’endomorphisme de K" canoniquement 
associé à M\ on vérifie que : 

n 

tr(M) = Oÿ- 

9. Modules 

Soit A un anneau unitaire. On appelle 
A-module à gauche un ensemble E muni de 
deux lois de composition satisfaisant aux 
mêmes axiomes que les espaces vectoriels. 
On définit de même les A-modules à 
droite : cette fois 

a . (p .x) = (pa) . x . 

Par exemple, l’application (n, x) nx 
définit sur tout groupe abélien une struc- 
ture de Z-module. 


Les résultats des chapitres 1 et 2 s’éten- 
dent sans changement dans ce cadre plus 
général, à ceci près que, lorsque l’anneau 
A n’est pas commutatif, les homothéties ne 
sont pas des endomorphismes, si bien qu’il 
n’est plus possible de munir le groupe 
additif £(E, F) d’une structure de 
A-module et l’anneau C(E) d’une structure 
de A-algèbre. Enfin, le dual d’un A-module 
à gauche doit être considéré comme un 
A-module à droite. 

Existence de bases 

Une différence essentielle avec les espaces 
vectoriels est la suivante : il peut arriver 
qu’une partie réduite à un élément non nul 
ne soit pas libre. C’est le cas pour les 
éléments de ZjnZ, considéré comme 
Z-module. 

De plus, alors que, dans tout espace 
vectoriel, il existe des bases (cf. théo- 
rème 8), il n’en est pas de même dans tout 
module, même lorsqu’il existe une partie 
génératrice réduite à un seul élément ; c’est 
le cas pour Z/nZ . Un module admettant 
une base est dit libre. 

Existence de supplémentaires 

De même, le théorème 9 ne se généralise 
pas à tous les modules. Ainsi, le SOUS- 
module du Z-module Z engendré par 2 
n’admet pas de sous-module supplémen- 
taire. Un sous-module admettant un sup- 
plémentaire est appelé facteur direct. 

On dit qu’un A-module E est semi- 
simple si tout sous-module de E est un 
facteur direct. La théorie des modules 
semi- simples est utile pour la réduction des 
endomorphismes : Soit en effet U un 
endomorphisme d’un espace vectoriel E, 
et A le sous-anneau de L(E) engendré par 
U. L’application (V, x) l ~~* V(.v) fait de E 
un A-module. Les sous-modules de E ne 
sont autres que les sous-espaces vectoriels 
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de E stables par U. Pour que le module E 
soit semi-simple, il faut et il suffit que tout 
sous-espace vectoriel stable par U admette 
un supplémentaire stable. On dit alors que 
U est semi-simple. 

Plus généralement, la théorie des modu- 
les semi- simples est utile pour la représen- 
tation linéaire des groupes (cf. groupes - 
Groupes de Lie), où elle intervient sous le 
nom de complète réductibilité. 

Modules de type fini 

On dit qu’un A-module E est de type fini 
s’il existe une partie génératrice finie de E. 
(Ici, la terminologie « de dimension finie » 
serait désastreuse, puisqu’un module de 
type fini peut très bien ne pas avoir de 
base.) Même lorsque E est un A-module 
libre de type fini, il peut arriver qu’il existe 
deux bases finies de E n’ayant pas le même 
nombre d’éléments. Cependant, ce phéno- 
mène ne se produit pas lorsque l’anneau A 
est commutatif. 

On peut envisager deux généralisations 
« raisonnables » du théorème 11 concer- 
nant les sous-espaces vectoriels des espaces 
vectoriels de dimension finie : 

1. Un sous-module d’un A-module de 
type fini n’est pas, en général, de type fini ; 
c’est cependant le cas lorsque l’anneau A 
est noethérien. L’importance de ce cas 
apparaît dans la théorie des polynômes (cf. 
anneaux commutatifs) et en géométrie 
algébrique. 

2. Un sous-module d’un A-module 
libre n’est pas nécessairement libre ; c’est 
cependant le cas lorsque l’anneau A est 
principal. Les résultats sont riches en 
applications pour la théorie des groupes 
abéliens et la réduction des endomorphis- 
mes, à propos des diviseurs élémentaires 
(cf. théorie spectrale). 


Applications multilinéaires 
et déterminants 

Les résultats des chapitres 6 et 7 s’étendent 
sans changement au cas des A-modules 
libres de type fini sur un anneau commu- 
tatif, sauf les critères d’indépendance 
linéaire et d’inversibilité. En particulier, 
pour qu’un endomorphisme U soit inver- 
sible, il faut et il suffit que det U soit 
inversible dans l’anneau A. Ainsi modifié, 
ce critère d’inversibilité permet d’étudier 
les équations linéaires à coefficients entiers 
et, plus généralement, suivant les métho- 
des de Dedekind et de Kronecker, les 
entiers algébriques. 

LUCIEN CHAMBADAL et JEAN-LOUIS OVAERT 
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L a notion d’espace métrique, introduite 
en 1906 par M. Fréchet et développée 
peu après par F. Hausdorff, est directe- 
ment issue d’une analyse des principales 
propriétés de la distance usuelle. L’exten- 
sion aux espaces métriques des propriétés 
de l’espace euclidien qui sont définissables 
à partir de la distance seule introduit un 
langage géométrique dans de nombreuses 
questions d’analyse et de théorie des nom- 
bres. C’est ainsi que l’on définit, à partir 
des boules, les ouverts. Par la manière 
naturelle dont s’introduisent les voisinages 
et les notions de limite et de continuité, 
l’étude des espaces métriques est une 
excellente introduction à la topologie géné- 
rale. 




1. Distances 

L’analyse des principales propriétés de la 
distance entre deux points dans l’espace 
euclidien conduit à la définition axiomati- 
que suivante. On appelle distance sur un 
ensemble E une application d de E X E 
dans l’ensemble des nombres réels 

positifs ou nul telle que, quels que soient les 
éléments x, y et z de E, on ait : 

(1) d{x,y) = Otsx =y, 

(2) d{x,y) =d(y,x), 

(3) d(x,z) a d(x,y) + d(y,z)\ 

cette dernière condition est appelée inéga- 
lité trianguhire car elle est la généralisation 
de la classique inégalité entre les longueurs 
des côtés d’un triangle. 

Un ensemble E muni d’une distance 
s’appelle un espace métrique. Si (E, d) et 
(E’, d') sont deux espaces métriques, une 
bijection f de E sur E’ sera dite une 
isométrie si elle conserve la distance, 

c’est-à-dire si d'(J[x ), f (y)) = t/(x, y) quels 
que soient X, } ! EE ; deux espaces métri- 
ques sont dits isométriques s’il existe une 
telle isométrie de l’un sur l’autre et 
présentent alors, « par transport » au 
moyen de cette isométrie, des propriétés 
semblables. 

Exemples 

On verra dans ce qui suit que la notion 
d’espace métrique recouvre un matériau 

mathématique très varié. Comme exemple 

extrême, remarquons que tout ensemble 

peut être muni de la distance, dite triviale , 
définie par d(x, x) = 0, d(x, y) — 1 si * ^ 
y . Si E est un espace métrique de distance 
d, tout sous-ensemble A de E est un espace 
métrique, dit sous-espace métrique de E 


651 




MÉTRIQUES ESPACES 


pour la distance induite d’ définie par 
d'(x, y) = d(x, >’), x, y E A 

Une classe très importante d’espaces 
métriques est constituée par les espaces 
vectoriels normés , en définissant ici la 
distance de deux éléments x et y comme la 
norme de leur différence, soit : 

d(x,y)=\\x-yh 

la distance ainsi obtenue est invariante 
pour les translations de l’espace vectoriel, 
c’est-à-dire d( X — a, y — a) = d(x, y) quels 
que soient les éléments x, y et a. Nous 
renvoyons à l’article espaces vectoriels 
normes pour de nombreux exemples, 
relatifs à l’analyse fonctionnelle notam- 
ment, et mentionnerons seulement ici 
les trois distances suivantes, qui sont 
déduites des normes correspondantes, sur 

R 2 : 


dAx,y) =|*i— y t \ +|* 2 — yi\ =1*— y h, 
d 2 (x,y) =V(* 1 — y\f +(* 2 —y 1 f =1*— yL 
d,(x,y) = sup ( |* , — 7 i|,|* 2 — y 2 \), 

où x = (*|, *2)- y = O"’!’ y 2)' Ces distances 
vérifient les inégalités : 

^3 ^^2 ^ ^ 1 ^ 2 d 3 , 

dont on verra des conséquences plus bas. 
Si (E. 6) et (E’, 6’) sont des espaces 
métriques, on peut utiliser ce qui précède 
pour définir des distances 6, sur le produit 
cartésien E X E’, en posant : 

où i = 1, 2, 3, et où les d , sont les distances 
sur R 2 ci-dessus. 

Les espaces vectoriels normés sont les 
espaces métriques dont les propriétés 
« ressemblent le plus » à celles des espaces 
numériques habituels. Donnons mainte- 
nant des exemples qui ne rentrent pas dans 
ce cas. 


Lu droite numérique achevée. Désignons 
par R la droite numérique achevée, 
R= RU { — oo } U { + oo}, qui est obte- 
nue en adjoignant à l’ensemble R des 
nombres réels deux nouveaux éléments, 
que l’on désigne traditionnellement par 
— oo et + oo vu le rôle qu’ils jouent en 
analyse, et remarquons que T application /, 
définie par : 


m = 


x 

rrw 




/(+»)= + 1, /( oc) — — 1, 


réalise une bijection de R sur le segment 
[- 1, + 1], On peut donc transporter la 
distance usuelle sur R, en définissant une 
distance d sur R par : 


d{x,y) = \f(x)—f(y)\\ 

bien entendu f est une isométrie de R, 
muni de cette distance d , sur le segment 
fermé [- 1, 1] muni de la distance habi- 
tuelle, puisqu’on a fait exactement ce qu’il 
fallait pour cela ! 

— Distances p-udiques sur Q. En théorie 
des nombres, on associe à tout nombre 
premier p une distance sur l’ensemble Q 
des nombres rationnels de la manière 
suivante. Pour tout entier n stricte- 
ment positif, soit sa valuation 

p-adique, c’est-à-dire l’exposant de p 
dans la décomposition de n en facteurs 
premiers ; ainsi u(n) — 0 pour n non 
divisible par p et t ){nn) = t)(«) + U(V). 
Prolongeons alors V à l’ensemble Q* des 
rationnels non nuis en remarquant que si 
x = ± rj3, alors v(x) — u(r) — v(s) ne 
dépend que du rationnel X et non du choix 
de la fraction rjs ; on vérifie facilement que 
l’on a : 


(a) i>(— z)=v(z), 

(b) v (z + z ') < inf (r (z ), v (z ')), 
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pour z, z E Q*. On définit alors la distance 
p-adique sur Q par : 

d(x,x) = 0, 
d{x,y) =p-'i*-y\ 

où x, >’EQ. La condition (1) est claire, et 
la condition (2) résulte de (a). La condition 
(b) entraîne que l’on a la condition (3'), qui 
entraîne (3) : 

(3') d(x,z) 4 sup {d{x,y),d(y,z)). 

Un espace métrique dont la distance 
vérifie la condition (3'), plus forte que 
l’inégalité triangulaire (3), est dit ultrCWîé- 
trique ; comme on le verra, ces espaces ont 
des propriétés très particulières. 

Le langage géométrique 

Les boules, définies à partir de la distance 
comme dans l’espace euclidien, consti- 
tuent la notion géométrique essentielle 
dans les espaces métriques. Dans un 
espace métrique E de distance d , on 
appelle boule ouverte de centre x 0 (z E et de 
rayon r > 0, l’ensemble des points de E 
dont la distance à x 0 est strictement infé- 
rieure à r, soit : 

B(x 0 ,r) = [x EE|ûf(x 0 ,x) < r} ; 

de manière analogue, on définit la boule 
fermée de centre et de rayon r : 

B f (x 0 , r) = {x E E|rf(x 0 ,x) < r } ; 

la justification des qualificatifs ouvert et 
fermé apparaîtra plus bas. Nous ren- 
voyons aux figures 1, 2 et 3 de l’article sur 
les espaces vectoriels NORMÉS pour une 
représentation des boules quand on munit 
R 2 des distances rfj, d 2 et d 3 déjà mention- 
nées. Les inégalités établies entre ces 
distances se traduisent par les inclusions : 

B 3 (x, ï) c Bi (jc, r) CI B 2 (*,/■) C B 3 (x,r), 


en désignant par B, la boule pour la 
distance d , (cf. figure). 



B 2 (x, r) B^x, r) 


Si A est une partie d’un espace métrique 
E et x G E, on appelle distance de x à A 
la borne inférieure de l’ensemble des 
nombres d(x , y) pour y E: A, soit : 

d (*, A) = inf d (x,^) ; 

yE A 

c’est le rayon de la plus grande boule 
ouverte de centre x qui ne rencontre pas A. 
Pour bien expliquer cette notion, établis- 
sons la relation : 

| d {x, A) — d (x A) | 6 d (x,x '), 

pour deux éléments X et x' quelconques 
de E. Par définition de la borne infé- 
rieure, pour tout £ > 0, il existe y E A tel 
que : 

d(x,y ) < d(x, A) + £ ; 

par suite, d’après l’inégalité triangulaire, 

d(x’,y) ^ d(x',x ) + d(x,y) 

^ d(x,x') + d (x, A) + £, 
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ce qui entraîne : 

d(x',A) 6 d(x\y) ^ d(x,x') + d(x, A) + e, 
donc : 

d(x A) ^ (x,* ') + d (x, A) + 6, 

et, par suite, puisque e est quelconque, 

^(x',A) — d(x, A) < c/(x,x') ; 

échangeant les rôles de x et x' et rassem- 
blant les deux résultats, on obtient la 
conclusion recherchée. 

Continuons à transposer le vocabulaire 
géométrique usuel ; nous dirons qu’un 
sous-ensemble A d’un espace métrique E 
de distance d est borné s’il est contenu dans 
une boule. Cela équivaut à dire que le 
nombre : 

d(A) = sup d{x y y), 

x,y<E A 

appelé diamètre de l’ensemble A, est fini. 
Le langage géométrique que nous venons 
d’introduire dans les espaces métriques 
constitue un support pour une intuition 
géométrique qui est très utile mais doit être 
soigneusement contrôlée car elle n’est pas 
sans surprises et risque d’utiliser implici- 
tement, sans s’en rendre compte, des 
propriétés de l’espace euclidien plus riches 
que sa seule structure métrique. Par exem- 
ple, si A est une boule de rayon r, on 
montre facilement avec l’inégalité triangu- 
laire que son diamètre est ^ 2 r, mais on 
ne peut affirmer l’égalité que si on a un 
espace vectoriel normé. Les espaces ultra- 
métriques présentent ainsi de nombreux 
phénomènes « pathologiques », en ce sens 
qu’ils sont contraires à l’intuition géomé- 
trique courante ; le mathématicien qui 
travaille sur ces espaces est ainsi amené à 
développer une « intuition géométrique » 
qui peut sembler tout à fait ésotérique au 
profane... Ainsi, dans un tel espace, il n’y 


a pas de boules sécantes , en ce sens que si 
deux boules B(x, r) et B(Y, r*), r ^ Y’, ont 
un point commun y, alors B(x, r) C 
B (Y, r*). En effet, soit r un point quelcon- 
que de B(x, r), c’est-à-dire d(x 9 z) < r ^ 
Y ; on a, d’après (3'), d(}\ z) ^ 

sup (d(y, x),d(x, z)) < r puisqu’on a aussi 
d(x, v) < r car y G B(x, r). Utilisant à 
nouveau (3'), on a : 

d(x \ z ) < sup {d(x \ y),d(y, z)) < r f 

donc z G B (Y, r), ce qui établit l’inclusion 
annoncée ; on aurait une démonstration 
analogue pour deux boules fermées. Nous 
verrons dans le chapitre suivant que cette 
particularité des espaces ultramétriques 
nous réserve encore bien des surprises. 

2. Topologie d'un espace métrique 

À partir des boules, on peut construire sur 
un espace métrique les principales notions 
topologiques qui permettent de « faire de 
l’analyse ». À ce propos, par la clarté avec 
laquelle les notions de limite et de conti- 
nuité s’expriment au moyen de la termi- 
nologie que nous allons introduire, la 
théorie des espaces métriques constitue un 
excellent préliminaire à la topologie géné- 
rale. 

Ouverts et fermés 

Soit E un espace métrique de distance d . 
On dit qu’un sous-ensemble U de E est 
ouvert si pour tout points E U il existe une 
boule ouverte de centre x contenue dans 
U. D’après un principe général de logique, 
l’ensemble vide, qui n’a pas d’élément, est 
donc ouvert. Faisons le lien avec la termi- 
nologie introduite plus haut en montrant 
qu 'une boule ouverte B(x 0 , 1.) est un ensem- 
ble ouvert : en effet, si x E B(x 0 , r), 
l’inégalité triangulaire entraîne que B (.Y, /) 
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C B(x 0 , r) pour r’ = r — d(x 0 , x) > 0. On 
voit donc qu’un ensemble U est ouvert si 
et seulement si c’est une réunion de boules 
ouvertes. 

La famille des ouverts d’un espace 
métrique vérifie les propriétés suivantes 
qui sont prises en topologie générale 
comme axiomes pour définir une topolo- 
gie : (0,) E et 0 sont des ensembles 
ouverts ; (O^) Toute réunion (finie ou pas) 
d’ensembles ouverts est un ensemble 
ouvert; (0,) Toute intersection finie 
d’ouverts est un ouvert. 

Montrons ce dernier point. Soit U„ U 2 , 
.... des ouverts ; si l’intersection est 
vide, c’est terminé d’après (0,). Sinon, soit 
X E u , m U rt = U ; par hypothèse, il 
existe r„ i = 1, . . . . tels que B(x, r t ) C U,* 
et par suite B(x, r) C U pour r = inf (r 1? 

0i)- 

On dit que deux distances d { et d 2 sur 
un même ensemble E sont (topologique- 
ment) équivalentes si les ouverts corres- 
pondants sont les mêmes. Cela signifie que 
toute boule ouverte Bj de centre Xq par 
rapport à la distance t/j contient une boule 
B 2 de centre x 0 (par rapport à la distance 
df), puisque x 0 G B„ qui, étant un ouvert 
pour d[, est aussi un ouvert pour d 2 , et vice 
versa. C’est ce qui se produit pour les trois 
distances d ,, d 2 et t/ 3 considérées plus haut 
sur R 2 , qui définissent les mêmes ouverts 
(cf. figure). Remarquons aussi que, sur R, 
la distance usuelle d définie à partir de la 
valeur absolue par d(x, y) = x y |, et 
pour laquelle les boules sont les intervalles, 
est topologiquement équivalente à la dis- 
tance d ’ pour laquelle R est un sous-espace 
métrique de R (cf. chap. 1), c’est-à-dire : 


Par passage au complémentaire, on 
définit la famille des fermés d’un espace 


métrique : un sous-ensemble F de E est dit 
fermé si son complémentaire dans E est un 
ensemble ouvert. Par exemple toute boule 
fermée By (x 0 , r) est un ensemble fermé ; en 
effet, si x 4 By (x 0 , r), on a : 

B(x, r') H By(x 0 , r) = 0 

pour r’ = r/(x 0 , x) — r > 0, comme cela 
résulte facilement de l’inégalité triangu- 
laire. Des propriétés (O,), (0,) et (0,) il 
résulte facilement que 0 et E sont des 
fermés ; toute intersection (finie ou pas) de 
fermés est un fermé ; toute réunion finie de 
fermés est un fermé. Si A est un SOUS- 
ensemble quelconque de E, il existe donc 
un « plus petit » (pour l’inclusion) ensem- 
ble fermé contenant A, à savoir l’intersec- 
tion A de la famille de tous les fermés qui 
contiennent A ; cet ensemble A est aussi le 
complémentaire du « plus grand » (tou- 
jours pour l’inclusion) ensemble ouvert ne 
rencontrant pas A, qui est la réunion des 
boules ouvertes ne rencontrant pas A. 
Ainsi, un point X G E appartient à A si et 
seulement si toute boule ouverte de centre 
X rencontre A, ce qui revient au fait que la 
distance de x à A est nulle : on dit alors que 
x est un point adhérent à A. L’ensemble 
fermé A s’appelle la fermeture, ou l’adhé- 
rence de A. On dit que A est partout dense 
dans E si A = E ; par exemple l’ensemble 
Q des nombres rationnels est partout 
dense dans R. 

Les notions précédentes sont la trans- 
position, au moyen des boules, de notions 
familières dans les espaces numériques et, 
comme telles, sont aussi l’objet d’un inves- 
tissement intuitif qui n’est cependant pas 
toujours justifié. Ainsi on pourrait penser 
que l’adhérence d’une boule ouverte est 
toujours la boule fermée de même centre 
et de même rayon mais, si cela est vrai pour 
les espaces vectoriels normés, les espaces 
ultramétriques nous réservent ici encore 
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des surprises. En effet, montrons que, dans 
un tel espace, toute boule ouverte B(Xq, r), 
qui est un ensemble ouvert comme nous 
l’avons vu, est aussi un ensemble fermé et, 
par suite, est sa propre adhérence. Il suffit 
pour cela de remarquer que si X £ B(x 0 , r), 
alors la boule B (.Y, r/2) ne rencontre pas la 
boule B(x n , r) car sinon, puisqu’il n’y a pas 
de boules « sécantes ». la boule de rayon 
r/2 serait contenue dans l’autre (cf. fin du 
chap. 1), d’où, en particulier, x B(Xq, r ), 
ce qui contredit l’hypothèse sur x 

Voisinages et continuité 

Introduisons maintenant les voisinages 
pour préciser la notion de continuité. Soit 
E un espace métrique de distance d. On dit 
qu’un ensemble V C E est un voisinage 
d’un point x (E E s’il contient un ouvert 
contenant x ; cette notion donc est « topo- 
logique » : elle ne dépend que des ouverts 
de l’espace métrique E, ouverts caractéri- 
sés, à leur tour, par le fait qu’ils sont 
voisinages de chacun de leurs points. En 
particulier, les boules ouvertes de centre x 
sont des voisinages de x et il en est de 
même des boules fermées puisqu’on a 
toujours B(x, r) C B^(x, r). Les boules 
ouvertes (ou les boules fermées) de centre 
X constituent un système fondamental de 
voisinages de x, en ce sens qu’un ensemble 
est un voisinage de x si et seulement s’il 
contient une telle boule ; on obtient un 
système fondamental dénombrable de voi- 
sinages en se limitant par exemple aux 
boules de rayon 1 /n, avec n entier positif. 

Soit maintenant E et E’ deux espaces 
métriques de distances respectives d et d ' 
etfune application de E dans E’. Analy- 
sons la notion de continuité telle qu’elle est 
suggérée de manière naturelle par la défi- 
nition classique (quand E = E’ = R muni 
de la distance usuelle définie à partir de la 


valeur absolue) : on dit quef’est continue 
en un point X 0 £ E si, pour tout nombre réel 
E > 0, il existe un nombre réel q > 0 tel 
que : 

d(x Q , x) < n =>d'(f(x 0 ), /(*)) < e, 

ce qui exprime l’inclusion : 

B(* 0 , n) c/ -\B'(f(xo), £)) ; 

or, dire qu’il existe q tel que l’on ait cette 
inclusion signifie que l’image réciproque 
par / de la boule B'(/(x 0 ), e) est un 
voisinage de x 0 dans E. Puisqu’une partie 
de E’ est un voisinage de f (x 0 ) si et 
seulement si elle contient une boule de 
centre f (x 0 ), on peut maintenant donner, 
en termes de voisinages seuls, la définition 
suivante de la continuité : f est continue en 
X 0 si et seulement si limage réciproque pur 
fde tout voisinage de f (x 0 ) est un voisinage 
de x 0 . 

Il en résulte que f est continue en tout 
point de E (on dit que f est continue, sans 
préciser davantage) si et seulement si 
l’image réciproque par / de tout ouvert de 
E’ est un ouvert de E. 

Les notions précédentes sont topologi- 
ques : elles ne dépendent que des ouverts 
des espaces considérés. 11 est utile d’avoir 
une notion de continuité plus forte, qui 
n’est plus seulement topologique, utilisant 
le fait que l’on peut « comparer » les 
voisinages de deux points distincts grâce 
aux rayons des boules. Plus précisément, 
on dira qu’une application f: E — ► E’ est 
uniformément continue si, pour tout £ > 0. 
il existe q > 0 tel que : 

d{x,y)<n=*d'(f(x),f<y))<e, 

ou encore : 

B(xn)c /-i(BV(*),c», 

pour touts G E. Un cas particulier de cette 
situation est fourni par les applications 
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lipschitziennes : on dit que f est lipschit- 
zienne de rapport k si on a : 

d'(f(x)J(y))<kd(x,y), 

quels que soient x, y dans E ; ainsi l’image 
réciproque parfde la boule de centre/ (jt) 
et de rayon r contient la boule de centre x 
et de rayon r/k. Par exemple, on a vu plus 
haut que, pour toute partie A de E, 
l’application qui à x G E associe sa distance 
à A est lipschitzienne de rapport 1. 

Le langage des suites 
Soit (u,) une suite de points d’un espace 
métrique E (de distance d). On dira de 
manière naturelle que cette suite converge 
vers un élément a G E pour n tendant vers 
l’infini si d(a,U n ) — » 0 pour rc — ►(». Pour tout 
e > 0, il existe donc un entier N tel que : 

n > N =>d(a,u„) < E, 
c’est-à-dire : 

n ^ N=>«„eB(a, E ); 

ainsi u n — » a pour n — ► oo si, pour tout 
voisinage V de a, il existe un entier N tel 
que u n G V pour N. On peut dire aussi 
que V contient les u n sauf pour un nombre 
fini d’entiers n. Remarquons que la notion 
de suite convergente est topologique. 

La définition précédente généralise bien 
entendu la notion de limite d’une suite dans 
l’espace R" pour l’une quelconque des dis- 
tances équivalentes habituelles. À titre 
d’exemple, cherchons maintenant à quelle 
condition une suite (u„) de nombres réels 
positifs va converger vers l’élément + oo 
dans la droite réelle achevée R munie de la 
distance d décrite dans le chapitre 1 . On a : 


pour tout x ^ 0 . Soit £ > 0 ; on aura 
d(-\~ CO, U n ) < e, pour U n > (1/e) — 1. Ainsi 


u n — *■ + oo pour n — * oo si et seulement si, 
pour tout M = (1 je) — 1, il existe un entier 
N tel que : 

n > N => u n > M ; 

on retrouve la notion classique de suite de 
nombres réels « tendant vers l’infini » pour 
H — > oo. 

Dans un espace métrique E de distance 
d, le fait que tout point possède un système 
fondamental dénombrable de voisinages 
permet d’exprimer toutes les propriétés 
topologiques en termes de suites. Mon- 
trons par exemple qu’un point Xq est adhé- 
rent à une purtie A de E si et seulement s’il 
est limite dans E d’une suite de points de A : 
pour x adhérent à A, si on choisit pour tout 
entier positif n un point u n dans A Pi B(x 0 , 

1 jri), on obtient une suite de points de A 
qui converge vers X 0 , puisque d(x 0 ,U n ) < 
\/n ; réciproquement, si ( u n ) est une suite 
de points de A qui converge vers Xq, tout 
voisinage V de Xq contient tous les termes 
de la suite pour n assez grand et par suite 
A H V ^ 0. Un ensemble A est donc fermé 
si et seulement s’il contient les limites de 
toutes ses suites qui sont convergentes 
dans E ; ainsi, on peut définir les fermés, 
et par complémentarité les ouverts, à partir 
de la notion de suite convergente. De 
même, on montre qu’on peut caractériser 
la continuité d’une applicationfen termes 
de suites : une application f d’un espace 
métrique dans un autre est continue en un 
point x 0 si et seulement si, pour toute suite 
(u,) qui converge vers Xq, la suite image 
(/'(«„)) converge vers f (x 0 ). La compacité 
va nous donner d’autres exemples de 
l’importance de la notion de suite. 

Espaces métriques compacts 

On montre que tout sous-ensemble fermé 
et borné C de l’espace numérique R /; 
possède la propriété suivante, appelée 
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propriété de Borel-Lebesgue : pour toute 
famille (U,) d’ouverts de R' 7 dont la 
réunion contient C (on dit qu’on a un 
recouvrement ouvert de C), il existe une 
sous-famille finie U^, . . . . U, n dont la réu- 
nion contient C. L’importance de cette 
propriété dans de nombreuses questions 
fines d’analyse mathématique a conduit à 
étudier systématiquement les espaces topo- 
logiques qui la possèdent (cf. topologie 
GÉNÉRALE) . 

On dit qu’un espace métrique E est 
compact si, pour toute famille d’ouverts de 
E dont la réunion est égale à E, il existe une 
sous-famille finie possédant cette pro- 
priété. Ainsi, tout fermé borné C de R 77 , 
muni de la distance induite par celle de R", 
est un espace métrique compact (car les 
ouverts du sous -espace métrique C sont les 
intersections avec C des ouverts de R") ; en 
particulier, pour n = 1, le segment fermé 
[- 1, + 1] est compact et il en est donc de 
même de la droite numérique achevée R 
qui est isométrique à ce segment (cf. 
chap. 1). 

Tout espace métrique compact est de 
diamètre fini, ce qui exprime que la dis- 
tance entre deux points d’un tel espace est 
bornée ; on montre que tout sous-espace 
métrique fermé d’un espace métrique com- 
pact est compact. 

Avant de donner, en termes de suites, 
une caractérisation des espaces métriques 
compacts, il nous faut introduire une 
nouvelle notion. On dit qu’un point a est 
un point d'accumulation d’une suite (u n ) 
si tout voisinage de a contient les points u n 
pour une infinité d’entiers n ; ainsi, si 
la suite (u„) converge vers a , ce point a 
est le seul point d’accumulation, mais il 
peut exister plusieurs points tels, chacun 
d’entre eux étant caractérise par le fait 
qu’on peut trouver une sous-suite de la 
suite initiale qui converge vers ce point. 


Nous pouvons maintenant énoncer la 
propriété de Bolzano- Weierstrass , vraie 
pour tout espace topologique compact, 
mais qui caractérise les espaces métriques 
compacts parmi les espaces métriques : 
toute suite possède QU moins un point 
d’accumubtion. 

Nous renvoyons à l’article topologie 
générale pour l’examen des très impor- 
tantes propriétés des espaces compacts en 
mentionnant seulement ici le résultat sui- 
vant, de la théorie des espaces métriques, 
connu sous le nom de théorème de Heine- 
Borel : une application continue d'un espace 
métrique compact dans un espace métrique 
est uniformément continue. Donnons la 
démonstration qui est très simple et mon- 
trera comment on utilise la propriété de 
Borel-Lebesgue. Soit E et E’ des espaces 
métriques de distances respectives d et d 
e t f : E — »E’ une application continue. 
Choisissons un nombre réel positif £. La 
continuité de f entraîne que, pour tout 
point x G E, il existe un nombre réel n(x), 
dépendant de x, tel que : 

d(x t y) < n(x) => < e; 

les boules ouvertes B(x,q(x)/2), X G E, 
forment un recouvrement ouvert de E dont 
on peut, puisque E est compact par hypo- 
thèse, extraire un recou vrementj ni fermé 
de boules de centres x^ Ab, . . . . X IV Soit 
maintenant q le plus petit des nombres 
n(*i)/2, .... r\(x n )/2. Montrons que : 

d(x,y) < r\=>d '(f (x ),f(y )) < e, 

ce qui établira l’uniforme continuité de f. 
En effet, le point x appartient à au moins 
une des boules du sous-recouvrement fini, 
soit la boule de centre x j9 c’est-à-dire d(x h x) 
< n(-ï/)/2, d’où : 

d '</(*,), /(•*)) < Y 
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puisque d(x,y) < n(*,)/2, on a, par l’iné- 
galité triangulaire, d(x n y) < q(x,-), d’où : 

et par suite, en utilisant encore une fois 
l’inégalité triangulaire, 

^ ) + d r {f ( Xi ) J (y)) < E. 

Les espaces numériques R” ne sont pas 
compacts, mais tout point possède un 
système fondamental de voisinages com- 
pacts constitué par les boules fermées. On 
dit qu’un espace métrique dans lequel tout 
point a un système fondamental de voisi- 
nages compacts (ce qui revient à dire que, 
pour tout X , les boules fermées de centre x 
et de rayon assez petit sont compactes) est 
un espace localement compact. 


3. Espaces métriques complets 

Alors qu’au chapitre précédent les notions 
introduites (à l’exception de l’uniforme 
continuité ; cf. infra) sont topologiques, les 
notions de ce chapitre dépendent de 
manière essentielle de la distance. 

Suites de Cauchy 

B. Bolzano et A. Cauchy ont dégagé 
l’importance du critère de convergence 
suivant, qui ne fait pas intervenir la valeur 
de la limite : une suite (u,) de nombres réels 
est convergente si et seulement si, pour tout 
6 > 0, il existe un entier N tel que : 

P >N,q => \u p — u q | < 6. 

(cf. calcul infinitésimal Calcul à une 
variable). D’où le nom de suite de Cauchy 
donné à une suite ( u n ) d’éléments d’un 
espace métrique E, de distance d, telle que, 


pour tout e > 0, il existe un entier N tel 
que : 

p ^ N,q ^ N =î> d{u p ,u q ) < s. 

Il est facile de voir que toute suite 
convergente de limite a , est a fortiori 

une suite de Cauchy. Pour tout s > 0, il 
existe N tel que n ^ N => d(u n , a) < e/2 ; 
pour p ^ N et q ^ N, on a donc, en 
appliquant l’inégalité triangulaire, d(u p , u Cj ) 
^ d(u p , a) + d(a , Uy) < E , Au contraire, 
l’exemple de l’ensemble des nombres 
rationnels montre qu’une suite de Cauchy 
n’est pas toujours convergente. On dit 
qu’un espace métrique, comme R", dans 
lequel toute suite de Cauchy est conver- 
gente, c’est-à-dire dans lequel les suites de 
Cauchy coïncident avec les suites conver- 
gentes, est un espace complet. 

Les notions de suite de Cauchy et 
d’espace complet ne dépendent pas que de 
la topologie de l’espace métrique. Pour 
illustrer ce fait, désignons par R, l’ensem- 
ble des nombres réels muni de la distance 
usuelle, définie à partir de la valeur abso- 
lue, et par R-, ce même ensemble muni de 
la distance induite par celle de R (cf. 
chap. 1) ; on a vu que les ouverts de Rj et 
R 2 sont les mêmes (ce qui signifie que les 
deux distances sur R sont équivalentes). 
Considérons la suite des entiers naturels, 
dont le n-ième terme est l’entier n ; ce n’est 
manifestement pas une suite de Cauchy 
pour la distance usuelle sur R, mais c’est 
une suite de Cauchy dans R % puisqu’elle 
converge vers l’élément + x dans R. 
D’autre part, l’espace R, est complet, 
tandis que l’espace R 2 ne l’est pas car la 
suite (de Cauchy) des entiers naturels n’est 
pas convergente dans cet espace : cela tient 
au fait que R^ n’est pas un sous-espace 
fermé de l’espace métrique R (qui est 
complet car isométrique au segment 
[—1, -|- 1]) ; plus généralement, la carac- 


659 



MÉTRIQUES ESPACES 


térisation des fermés au moyen des suites 
(cf. chap. 2) montre qu’un sous-espace 
métrique F d’un espace métrique complet 
est complet si et seulement s’il est fermé 
dans E. 

Dans l’exemple précédent, l’application 
identique i : R-, — ► R„ définie par i(x) = x 
pour tout X £ R, est continue, ce qui 
montre que l’image d’une suite de Cauchy 
par une application continue n’est pas 
nécessairement une suite de Cauchy. Par 
contre, les définitions montrent immédia- 
tement que l’image d’une suite de Cauchy 
par une application uniformément continue 
est une suite de Cauchy, donc une suite 
convergente si l’espace d’arrivée est com- 
plet. Donnons, comme application de cette 
remarque, un important théorème de pro- 
longement. 

Théorème de prolongement des applica- 
tions uniformément continues : Soit E un 
espace métrique, A un sous-ensemble par- 
tout dense de E (cela signifie, rappelons-le 
que tout point de E est adhérent à A) et F 
un espace métrique complet. Alors toute 
application /: A — ► F qui est uniformément 
continue se prolonge de manière unique en 
une application continue g : E — > F ; de 
plus, g est uniformément continue. 

Nous nous bornerons à indiquer l’idée 
de la démonstration. Pour X £ A, on doit 
avoir g(x) — f (jc), et il faut donc définir 
g(x) pour X £ A. Or, puisque A est dense, il 
existe une suite ( x n ) d’éléments de A qui 
converge vers x et, l’application g cherchée 
étant continue, on doit avoir nécessaire- 
mentg(x) = lim g(x„), avecg(.r„) =/(*„) ; 
mais la suite (f (x n )), image d’une suite de 
Cauchy par une application uniformément 
continue, est une suite de Cauchy et, puis- 
que F est complet, c’est une suite conver- 
gente, dont nous désignerons précisément 
la limite par g(x). Il reste à vérifier que g(s) 
ne dépend pas de la suite d’éléments de A 


qui converge vers Jt et que l’application g 
ainsi définie est uniformément continue, ce 
qui est un raisonnement élémentaire utili- 
sant l’inégalité triangulaire. 

Précisons enfin le lien entre les espaces 
métriques compacts et complets. Remar- 
quons d’abord qu’une suite de Cauchy a au 
plus un seul point d’accumulation : ou bien 
elle n’en a aucun et elle ne converge pas, ou 
bien elle a exactement un point d’accumu- 
lation et elle converge alors vers ce point. 
Par suite, la propriété de Bolzano- 
Weierstrass montre que tout espace métri- 
que compact est complet. Réciproque- 
ment, on montre qu’un espace métrique 
complet E est compact si et seulement s’il 
vérifie la propriété suivante de précompa- 
cité : Pour tout 6 > 0, il existe un recouvre- 
ment fini de E par des boules de rayon s. 

Complétion d’un espace métrique 

La construction, due à Cantor, des nom- 
bres réels comme classes d’équivalence de 
suites de Cauchy de nombres rationnels 
(« suites fondamentales » dans la termino- 
logie cantorienne) se transpose sans modi- 
fication à un espace métrique quelconque. 

Théorème de complétion. Pour tout 
espace métrique E, il existe un espace 
métrique complet Ê tel que E soit isomé- 
trique à un sous-espace partout dense de 
E ; de plus, l’espace E est déterminé à une 
isométrie près. 

On dit que Ê est le complété de E, et on 
identifie dans la pratique E au sous-espace 
partout dense de E qui lui est isométrique. 
Ainsi, le complété de l’ensemble des ration- 
nels pour la distance usuelle est l’ensemble 
des réels muni de la distance usuelle. Si on 
considère sur l’ensemble des rationnels la 
distance p-adique associée à un nombre 
premier y, on obtient comme complété 
l’ensemble des nombresp-adiques (cf. théo- 
rie des NOMBRES Nombres p-adiques). 
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Esquissons la construction du complété 
E. Nous dirons que deux suites de Cauchy 
(x,) et (y n ) d’éléments de E sont équiva- 
lentes si d(x m y n ) — + 0 pour n — ► x. Il est 
clair que l’on définit ainsi une relation 
d’équivalence sur l’ensemble £ de toutes les 
suites de Cauchy d’éléments de E ; nous 
désignerons par E le quotient de £ par cette 
relation d’équivalence, et nous allons cons- 
truire une distance sur E. Si x = (* ) et 
}' = sont deux suites de Cauchy, on 
montre que la suite de nombres réels 
d(x n , y n ) est convergente pour n — * oo (car 
c’est une suite de Cauchy) et que la limite 
ne change pas si on remplace x et y par des 
suites qui leur sont respectivement équi- 
valentes ; cette limite ne dépend donc que 
des classes d’équivalence x et y des suites 
x et y et nous la désignerons par 5(jC v v). On 
vérifie maintenant facilement que ô est une 
distance sur Ê ; le fait que Ê soit complet 
pour cette distance se montre par le célèbre 
« procédé diagonal » de Cantor, dont nous 
allons indiquer le principe : soit (pé^\ 

= (JC 1 W,...)*,W, . ..) une suite de Cauchy 
d’éléments de E (pour simplifier les nota- 
tions, nous commettons ici l’abus de lan- 
gage qui consiste à identifier x ^ avec sa 
classe d’équivalence) ; on montre alors que 
la suite (x^) converge dans E vers la classe 
de la suite diagonale (x/ !) , x 2 (2) , .... X n ^ n \ • ••)• 
Construisons maintenant une injection 
de E dans E. Pour a G E, nous désignerons 
par cp(fl) G E la classe d’équivalence de la 
suite constante (a, a, . . . . a, . ..) ; il est clair 
que Ô(cp(a),cp(/?)) = d(a,b) y et par suite cp 
réalise une isométrie de E sur le sous- 
espace métrique F de E formé des classes 
d’équivalence des suites constantes. 
L’ensemble F est partout dense dans E car 
si x = (x n ) est une suite de Cauchy d’élé- 
ments de E, alors la suite (<p(x rt )) d’élé- 
ments de F converge vers x dans E. 


La méthode 

des approximations successives 

On doit à E. Picard une méthode de cons- 
truction de solution d’équations par 
approximations successives (équations 
numériques, théorèmes d’existence et 
d’unicité d’équations différentielles ou inté- 
grales ; cf. équations différentielles, 
chap. 1 ; équations intégrales, chap. 2) 
que l’on peut formuler de la manière sui- 
vante dans le cadre des espaces métriques. 

Théorème du point fixe . Soit E un espace 
métrique complet etfune application de e 
dans lui-même telle qu’il existe une cons- 
tante k, 0 < k < 1, avec d(f (x)fi{y)) ^ 
kd(x,y) quels que soient x et y dans E (on 
dit quefest une application contractante). 
Alors l’équation : 

f’(x) = x 

a une solution unique dans E. De plus, quel 
que soit X 0 G E, la suite (x w ) définie par 
récurrence par .v, =f(x 0 ), X„ +l —f(x„) 
converge vers cette solution. 

La démonstration est très simple et on 
voit clairement le rôle joué par les suites de 
Cauchy. Remarquons d’abord que l’unicité 
est évidente : si f(x) = x et f (y) = y, on 
aura d(f(x)f(y)) = d(x,y) d(x,y), d'où 
d(x,y) = 0. Il suffit donc de montrer que la 
suite (x„) est convergente car, si sa limite est 
x, on obtient immédiatement x = f (x) en 
faisant tendre n vers l’infini dans la relation 
de récurrence X n +\ =/(x„). Or on a : 

d(x p+h x p ) = d(f(x p ),f(x p _ ,)) < k d(x p ,x p _,), 

d’où, par récurrence sur 

d{x p+h x p ) 6 k p d(x h x 0 ); 

par l’inégalité triangulaire, on a mainte- 
nant, pour q ^ p, 

g — î 

d(x r+ i,x r ) < 

r =P r=p 
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soit, en remplaçant la progression géomé- 
trique de raison k par sa somme et en 
majorant cette dernière : 

kP 

d(x p ,x q ) < — ~jd(x h x 0 ), 

et donc 

d(x q ,X p ) - 0 pour p, q - m puisque 
0 < k < 1. La suite de Cauchy (,v n ) 
converge dans E vers une certaine limite x 
puisque E est complet. Remarquons que si 
on fait tendre y vers l’infini dans l’inégalité 
précédente, on obtient : 

kP 

d{x,x p ) < j—^ d (x u x Q ) 1 

qui précise la rapidité de convergence de 
la suite (x n ) vers x. 


4. La propriété de Baire 

Les sous-espaces ouverts des espaces 
métriques complets et les espaces métri- 
ques localement compacts possèdent la 
propriété suivante, appelée propriété de 
Baire, qui joue un rôle important dans de 
nombreuses questions d’analyse : Si U„ est 
une suite d’ouverts partout denses, alors 
l’intersection des U„ est un ensemble partout 
dense . 

Sous le nom de « méthode de la caté- 
gorie », cc résultat a été utilisé systémati- 
quement par l’école mathématique polo- 
naise pour démontrer de profonds 
théorèmes (théorème du graphe fermé, 
théorème de Banach-Steinhaus ; cf. espa- 
ces vectoriels NORMÉS). 

Par passage au complémentaire, on 
peut énoncer cette propriété : si F n est une 
suite de fermés dont le complémentaire est 
partout dense, alors la réunion des F„ a un 
complémentaire partout dense. On dit 
qu’un ensemble A est rare si le complé- 


mentaire de son adhérence est partout 
dense ; ainsi, la propriété de Baire entraîne 
que, si un ensemble est réunion dénom- 
brable d’ensembles rares (on dit qu’un tel 
ensemble est maigre ), son complémentaire 
est partout dense. En particulier ce com- 
plémentaire est non vide ; ce type de 
raisonnement a été utilisé par S. Banach 
pour démontrer l’existence de fonctions 
possédant des singularités données à 
l’avance. Voici maintenant, pour terminer, 
un énoncé faisant intervenir la notion 
d’ensemble maigre et permettant, grâce à 
elle, de « dire quelque chose » d’une fonc- 
tion qui est limite simple d’une suite de 
fonctions continues (on sait qu’une telle 
limite n’est pas nécessairement une fonc- 
tion continue) : Si E est un espace métrique 
complet et F un espace métrique, soit f n une 
suite d’applications continues de E dans F 
telles qu’en chaque point x G E la suite 
(j n (x)) converge dans F vers un élément 
f (.y). Alors l’ensemble des points x de E où 
/ n’est pas continue est un ensemble 
maigre. 

JEAN-LUC VERLEY 
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D ans la plupart des civilisations par- 
venues au stade de l’écriture, les 
nombres entiers ont, dès l’origine, été liés 
à des pratiques religieuses ou magiques, et 
leurs propriétés ont exercé une sorte de 
fascination sur les esprits, qui est loin 
d’être disparue de nos jours, où la « numé- 
rologie » conserve des adeptes ; il n’est 
donc pas étonnant que ce soit au sein de 
l’école pythagoricienne, imbue de mysti- 
cisme, qu’ait débuté l’étude scientifique de 
ces propriétés. Cette école entendait 
d’ailleurs mener de front les développe- 
ments de la géométrie et de l’arithmétique 
en une « arithmogéométrie » où certains 
types de nombres étaient associés à des 
figures ; on associait par exemple, de façon 
assez naturelle, les nombres n 2 aux figures 
carrées : c’est ainsi que les pythagoriciens 
découvrent la formule 1 + 3 + 5 + ... 
+ (2 n - 1) = n 2 en inscrivant dans un 
carré de côté n les carrés de côtés 1 , 2 ,.... 
n — 1 ayant un même sommet. C’est aussi 
dans cette école, avec les « catégories » du 
pair et de l’impair, que commencent les 


réflexions sur la divisibilité : elles aboutis- 
sent, deux siècles plus tard, au magistral 
exposé d’Euclide. On sait qu’il démontre 
(aux notations près) l’existence et l’unicité 
de la décomposition d’un entier positif en 
facteurs premiers, et, par un raisonnement 
très ingénieux, l’existence d’une infinité de 
nombres premiers. 

Aux pythagoriciens remontent égale- 
ment les premiers exemples d’équations 
diophantiennes, notamment la résolution 
de l’équation p 1 + q 1 = r 2 en nombres 
entiers ; c’était, dans leur « arithmogéomé- 
trie », la recherche des triangles rectangles 
à côtés commensurables. Diophante 
d’Alexandrie lui-même (sans doute au 
IV e siècle apr. J.-C.), s’il traite un grand 
nombre d’exemples de telles équations ou 
systèmes d’équations, ne s’intéresse en 
général qu’à la recherche de solutions en 
nombres rationnels , non nécessairement 
entiers. Mis à part quelques résultats isolés 
des mathématiques chinoise et indo-arabe 
sur des équations diophantiennes du pre- 
mier et du second degré, la théorie des 
nombres ne recommence à se développer 
qu’avec Pierre de Fermât. Ses contribu- 
tions portent à la fois sur la théorie de la 
divisibilité, avec le fameux théorème 
a p 1 = 1 (mod p) pour tout nombre pre- 
mierp, et sur les équations diophantiennes, 
où on lui doit la première méthode géné- 
rale d’attaque, la « descente infinie », dont 
le domaine d’application n’est pourtant 
pas défini avec précision et dépend avant 
tout de l’ingéniosité du mathématicien qui 
l’applique. Au XVIII e siècle, L. Euler, J.-L. 
Lagrange et A.-M. Le Gendre, s’inspirant 
des idées de Fermât, prouvent la plupart 
des théorèmes seulement énoncés par ce 
dernier, et donnent en tout cas une solu- 
tion complète pour les équations diophan- 
tiennes du second degré à deux inconnues ; 
c’est à ce propos qu’intervient une tech- 
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nique nouvelle, celle des fractions conti- 
nuées, premier exemple d’utilisation 
d’approximations diophantiennes pour la 
résolution d’équations diophantiennes. 

Jusque-la, les procédés de résolution 
d’équations diophantiennes consistaient 
en des manipulations algébriques élémen- 
taires plus ou moins subtiles, pour permet- 
tre une application judicieuse de la théorie 
de la divisibilité des entiers rationnels. A 
partir du début du XIX e siècle, toutes les 
parties des mathématiques vont être pro- 
gressivement mises à profit pour résoudre 
les problèmes de théorie des nombres. 

Avec C. F. Gauss, développant des 
ébauches peu concluantes d’Euler, c’est 
d’abord l’extension de l’idée de divisibilité 
aux corps de nombres algébriques réels ou 
complexes ; il la développe en détail pour 
le corps Q(i) et, dans des notes non 
publiées de son vivant, pour certains corps 
cyclotomiques. Il faudra tout l’effort de 
l’école allemande du XIX e siècle 
(E. E. Kummer, L. Kronecker, R. Dede- 
kind) pour surmonter, par la création de la 
théorie des idéaux, les difficultés provenant 
du fait que les anneaux d’entiers algébri- 
ques ne sont pas principaux en général (cf. 
la partie C ci-après ■ Nombres algébri- 
ques), et amener ainsi la théorie de la 
divisibilité dans ces anneaux au même 
point que la théorie d’Euclide pour Z. Le 
premier succès de cette nouvelle théorie est 
le critère obtenu par Kummer pour la 
non-résolubilité de l’équation de Fermât 
x” -f- y n = z n , où n est premier, à savoir 
que n ne divise pas les numérateurs des 
(n — 3)1 2 premiers nombres de Bernoulli. 

C’est aussi avec Gauss que commence 
la théorie générale des formes quadrati- 
ques à coefficients entiers ; il traite en 
détail des formes binaires (dont la théorie 
équivaut à celle des corps quadratiques sur 
Q, comme devait le montrer plus tard 


Dedekind), et partiellement des formes 
ternaires. La théorie générale des formes 
quadratiques à n variables (théorèmes de 
réduction, de finitude et de représentations 
des formes les unes par les autres) est 
édifiée par F. G. Eisenstein, C. Hermite, 
H. J. S. Smith, H. Minkowski et H. Hasse, 
et prend sa forme quantitative générale 
avec les travaux de C. L. Siegel, qui utilise 
largement la théorie des fonctions analy- 
tiques et introduit à cette occasion la 
notion de fonction modulaire à n variables 
(cf. formes quadratiques) . Les théorèmes 
de finitude sont d’autre part étendus par 
C. Hermite, C. Jordan et H. Poincaré aux 
formes de degré ^ 3. 

Enfin, on sait que Gauss avait aussi 
découvert les fonctions elliptiques et la 
fonction modulaire (d’une variable), sans 
rien publier d’ailleurs sur ces sujets, et il 
n’avait pas manqué d’observer les liens 
entre cette théorie et certains problèmes de 
théorie des nombres. Pendant tout le 
XIX e siècle, l’exploration de ce nouveau 
domaine est menée avec vigueur, notam- 
ment par C. Jacobi, C. Hermite et L. Kro- 
necker. Les résultats les plus profonds sont 
obtenus par ce dernier dans son étude de 
la multiplication complexe des fonctions 
elliptiques, qui le conduit au premier 
exemple de corps de classes. 

P. G. Lejeune-Dirichlet, de son côté, 
inaugure deux nouvelles voies en théorie 
des nombres. D’abord, par sa « méthode 
des tiroirs », il montre comment traiter les 
questions d’approximations diophantien- 
nes autrement que par la théorie des frac- 
tions continuées, et l’applique aussitôt pour 
obtenir un des théorèmes fondamentaux de 
la théorie des nombres algébriques, le théo- 
rème des unités (cf. la partie C ci- après - 
Nombres algébriques). Après lui, d’autres 
méthodes encore sont introduites dans la 
théorie des approximations diophantien- 


664 



NOM BRES THÉORIE DES 


nés : Hermite utilise à cette fin sa théorie des 
formes quadratiques et Minkowski sa 
« géométrie des nombres », obtenant des 
estimations remarquablement précises par 
des considérations très intuitives sur la posi- 
tion relative d’un ensemble convexe de R” 
par rapport au réseau Z" (cf. approxima- 
tions diophantiennes) . J. Liouville, de son 
côté, obtenant le premier théorème de 
« non-approximation » des nombres algé- 
briques, donne le premier exemple effectif 
de nombres transcendants, et Hermite, en 
combinant habilement des méthodes 
d’approximation diophantienne à la théo- 
rie des fonctions analytiques d’une variable 
complexe, prouve en 1872 la transcendance 
du nombre e, résultat spectaculaire que 
F. Lindemann complète, dix ans plus tard, 
en établissant, par une méthode analogue, 
la transcendance de JT. 

L’autre contribution fondamentale de 
Dirichlet est l’introduction des séries qui 
portent son nom et dont il se sert pour 
démontrer le théorème de la progression 
arithmétique, ainsi que pour obtenir une 
expression explicite du nombre de classes 
d’idéaux d’un corps quadratique (cf. la 
partie A ci-après - Théorie analytique des 
nombres). Ces deux types d’application 
des séries de Dirichlet vont être considé- 
rablement développés : ils conduisent, 
d’une part, avec B. Riemann, J. Hada- 
mard et C. de La Vallée-Poussin à la 
démonstration du théorème des nombres 
premiers et, d’autre part, avec Dedekind, 
aux généralisations des fonctions L à tous 
les corps de nombres algébriques, préludes 
à des généralisations ultérieures encore 
plus vastes (cf. fonction ZÊTA). 

Le développement de la théorie des 
nombres, depuis la dernière décennie du 
XIX e siècle, se caractérise par l’apport de 
plus en plus important de deux théories qui 
jusqu’alors n’y avaient joué qu’un rôle 


secondaire et implicite : la géométrie 
algébrique et la théorie des groupes. Grâce 
aux puissants moyens empruntés à ces 
théories, on dispose pour la première fois 
de quelques théorèmes généraux sur les 
équations diophantiennes ; bien que l’on 
soit encore très loin d’une compréhension 
profonde des phénomènes étudiés, on peut 
espérer être sur la bonne voie et arriver un 
jour à une théorie unique qui engloberait 
à la fois ce que nous appelons maintenant 
la théorie des groupes algébriques, celle 
des « groupes arithmétiques » et une 
bonne part de la théorie des nombres. 

Avant de donner quelques indications 
sur ces développements, mentionnons que 
l’approfondissement des méthodes héri- 
tées du XIX e siècle a aussi permis d’impor- 
tants progrès : l’extension de la méthode 
d’H ermite pour la preuve de la transcen- 
dance de e a conduit, par une série 
d’améliorations successives (Siegel, Gel- 
fond), aux résultats généraux de A. Baker 
sur les nombres transcendants (cf. nom- 
bres transcendants) . Une évolution ana- 
logue pour les approximations diophan- 
tiennes (A. Thue, Siegel, Dyson) a de 
même permis d’améliorer le résultat initial 
de « non-approximation » de Liouville : le 
meilleur résultat (K. Roth) est que, pour 
un nombre algébrique non rationnel (X et 
p, q entiers (q ^ 1), on a, pour tout b > 0, 


(i) 





e(e) 

q 2 + t’ 


mais la démonstration de ce résultat ne 
donne aucun moyen de calculer effective- 
ment c(e) pour a et £ donnés. Baker, par 
ses méthodes, a obtenu la beaucoup moins 
bonne inégalité : 


( 2 ) 



> cq— d exp ((ln q) */*), 
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où d ^ 3 est le degré de a et k > d-\- 1, 
c étant cette fois une constante c(a, k ) que 
l’on peut minorer explicitement en fonc- 
tion de a et k. 

A. Thue avait déjà déduit de son 
théorème de « non-approximation », par 
un raisonnement très ingénieux, le fait que, 
si P(x, y) est un polynôme à deux variables, 
à coefficients entiers, homogène et de degré 
^ 3, alors l’équation P(x, y) = m, où m 
est entier ^ 0, ne peut avoir qu’un nombre 
fini de solutions (x, y) en nombres entiers. 
Ce théorème a été généralisé et mis sous sa 
forme définitive par Siegel en 1929 : Pour 
tout polynôme (homogène ou non) P(x, y) 
à coefficients entiers, tel que le genre de la 
courbe C d’équation P(x, y) = 0 soit ^ 1, 
il ne peut y avoir sur C qu’un nombre fini 
de points (x, y) à coordonnées entières. Ce 
résultat fait déjà intervenir une notion 
profonde de géométrie algébrique (le 
genre d’une courbe) dans sa formulation. 
Sa démonstration combine le théorème de 
« non- approximation » d’un nombre algé- 
brique avec le théorème de Mordell-Weil. 
Ici encore, la formulation même de ce 
théorème fait intervenir la géométrie algé- 
brique, et sa démonstration utilise un 
raisonnement de « descente infinie » sur la 
jacobienne de C (variété abélienne de 
dimension égale au genre de C). L. J. Mor- 
dell a conjecturé que, sous les hypothèses 
du théorème de Siegel, il n’y a même qu’un 
nombre fini de points de C à coordonnées 
rationnelles lorsque le genre de C est ^2. 
Cette conjecture a été démontrée en 1983 
par G. Faltings ; cette démonstration 
ouvre un nouveau chapitre de la théorie 
des nombres (cf. équations DIOPHANTIEN- 
nes). D’autre part, Baker, par ses métho- 
des, a pu dans certains cas améliorer le 
théorème de Siegel en donnant une majo- 
ration effective pour les solutions entières 
de P(x, y) = m; par exemple, pour l’équa- 


tion y 2 = x 3 -(- D, avec D ^ 0, on a 
nécessairement : sup ( x | , \y \ ) < exp 
( 10 10 D| 104 ). 

Une autre source de progrès en théorie 
des nombres est la géométrie algébrique 
sur un corps fini , développée par E. Artin, 
par H. Hasse et surtout par A. Weil. Ainsi 
une congruence algébrique telle que P(Xj, 

X r ) = 0 (mod p ), où p est premier, est 
une équation algébrique P(Xj, .... x r ) = 0 
entre les classes Xj modulo p des entiers .Y,, 
autrement dit entre éléments du corps fini 
ZIpZ = F,. Cette interprétation est une 
des raisons qui ont conduit à développer la 
géométrie algébrique sur un corps de base 
autre que les corps usuels R ou C (cf. 
géométrie algébrique). Il y a en particu- 
lier une parenté très étroite entre les corps 
de nombres algébriques et les corps de 
fonctions rationnelles sur une courbe 
d’équation P(x, y) = 0 à coefficients dans 
un corps fini ; toute la théorie de la divisi- 
bilité se développe de façon semblable dans 
les deux cas (cf. infra), et on peut aussi 
définir les « fonctions L » et la fonction 
zêta de la même manière pour ces deux 
types de corps. Le résultat fondamental 
obtenu par Weil est que, pour ces dernières 
« fonctions zêta » (qui sont ici rationnelles 
en p~ s ), F« hypothèse de Riemann » est 
vraie ; cela entraîne des majorations pour 
les sommes d’exponentielles qui jouent un 
grand rôle en théorie analytique des nom- 
bres (cf. la partie A ci-après - Théorie ana- 
lytique des nombres) : par exemple, si /(x) 
est un polynôme sur sans facteur carré 
et de degré impair m, on a l’inégalité (qu’on 
ne sait pas prouver par d’autres méthodes) : 


( 3 ) 



(m — 1 ) Vp, 


où (-) est le symbole de Le Gendre. Au 
moyen de cette inégalité, on prouve par 
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exemple que le plus petit non-résidu quadra- 
tique modulo p tend vers l’infini moins vite 
que /? 1 / 4V/f '~ l_£ ,/7 — * quel que soit £ > 0. 

Le passage d’une équation diophan- 

tienne P(X], X ( .) = 0 à la congruence 

modulo p correspondante P(Xj, .... X,.) 
= 0 (mod p) est un des procédés les plus 
anciens d’étude de ces équations. Mais on 
peut aussi considérer les congruences 
..., x r ) s 0 (mod p n ) pour tous les expo- 
sants /?, et, en un certain sens, l’existence 
de solutions pour tout ri est un résultat 
« proche » de l’existence de solutions de 
l’équation initiale (la différence de deux 
entiers peut être non nulle et divisible par 
une puissance élevée de p, mais non par 
toutes les puissances de p). En approfon- 
dissant cette idée, on a été conduit à 
l’introduction des nombres p-adiques de 
Hensel et à leurs généralisations : ils 
fournissent un procédé systématique pour 
« localiser » en un nombre premier (resp. 
un idéal premier) l’étude de l’anneau des 
entiers Z (resp. d’un anneau d’entiers 
algébriques), procédé tout semblable au 
développement en série entière au voisi- 
nage d’un point d’une fonction rationnelle 
sur une courbe algébrique (cf. la partie B 
ci-après - Nombres p-adiques) ; on touche 
la à une nouvelle et profonde influence de 
la géométrie algébrique, qui n’a cessé 
d’inspirer Hensel et ses successeurs. 

L’étude de la divisibilité dans les corps 
de nombres algébriques se conçoit main- 
tenant comme une synthèse « globale » des 
propriétés « locales » d’un tel corps en 
toutes ses « places » ; les outils essentiels 
pour en exprimer les résultats sont les 
groupes d'ctdè/es et d' idèles introduits par 
C. Chevalley (cf. la partie C ci-après - 
Nombres algébriques). Ces groupes sont 
naturellement munis de topologies, qui en 
font des groupes commutatifs localement 
compacts ; et on constate alors que les 


théorèmes fondamentaux sur la divisibilité 
dans les corps de nombres algébriques 
s’interprètent de façon extrêmement sim- 
ple et frappante en langage de la théorie 
des groupes topologiques. 

Mais ce n’est pas tout : en premier lieu, 
on a de même une interprétation remar- 
quable dans ce langage des résultats fon- 
damentaux de la théorie du corps de 
classes. Déjà, sous l’impulsion de D. Hil- 
bert, cette théorie avait été rattachée à la 
théorie de Galois (cf. corps) ; le problème 
central en est la détermination du groupe 
de Galois de l’extension abélienne maxi- 
male A, d’un corps de nombres algébri- 
ques k. Or, la théorie des idèles en donne 
une expression explicite : si 1^ est le groupe 
des idèles de k , P^. le sous -groupe (discret) 
des idèles principaux, C k = Ij-./P j, le 
groupe (compact) des classes d’ idèles et D /v 
la composante neutre de Q-, le groupe de 
Galois de A, sur k est canoniquement 
isomorphe à CJD k . On a des résultats tout 
à fait analogues pour la divisibilité et la 
théorie du corps de classes lorsque k est un 
corps de fonctions rationnelles sur une 
courbe algébrique définie sur un corps fini. 

En second lieu, toute la théorie de 
l’analyse harmonique générale (cf. analyse 
harmonique) est applicable aux groupes 
d’adèles et d’ idèles ; le développement de 
cette théorie a conduit Tate, Ono, Taïïia- 
gawa et A. Weil à insérer dans ce nouveau 
cadre les travaux de Hecke sur les fonc- 
tions L et ceux de Siegel sur les formes 
quadratiques (cf. fonction ZÊTA et formes 
quadratiques) . Pour aller plus loin et 
« sortir du commutatif », la voie qui semble 
aujourd’hui la plus prometteuse est la théo- 
rie des groupes de Lie (généralisée aux 
groupes algébriques, p-adiques et « adéli- 
ques » de façon convenable), et notam- 
ment celle des représentations de ces grou- 
pes dans des espaces fonctionnels 
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convenables (cf. GROUPES * Groupes de 
Lie). Déjà, on a subordonné à cette théorie 
les résultats classiques d’Hermite, de Jor- 
dan et de Minkowski sur la « réduction » 
des formes (A. Borel et Harish-Chandra) et 
la théorie arithmétique des fonctions auto- 
morphes, notamment celle des formes 
modulaires de Hecke, Siegel, Maass et 
Petersson (Shimura et Jacquet-Langlands). 
Il y a lieu d’espérer qu’on aboutira par cette 
voie à une généralisation satisfaisante de la 
théorie du corps de classes pour les exten- 
sions galoisiennes non abéliennes des corps 
de nombres algébriques ; peut-être aussi 
ces méthodes permettront-elles de com- 
prendre les raisons du succès de méthodes 
de théorie analytique des nombres telles 
que la méthode de Hardy-Littlewood (cf. la 
partie A ci-après ■* Théorie analytique des 
nombres). 

JEAN DIEUDONNÉ 

A. Théorie analytique des nombres 

Ce qu’on appelle la « théorie analytique des 
nombres » ne peut pas être considéré 
comme une théorie mathématique au sens 
usuel qu’on donne à ces mots, c’est-à-dire 
un système organisé de définitions et de 
théorèmes généraux accompagné d’appli- 
cations à des exemples importants. Il s’agit 
au contraire ici presque exclusivement de 
problèmes particuliers qui se posent en 
arithmétique et qui, pour la plupart, consis- 
tent à étudier (cf. calculs ASYMPTOTIQUES 
pour la position du problème et les nota- 
tions o et 0 de Landau) l’« allure à l’infini » 
de certainesfonctions définies par des condi- 
tions de nature arithmétique : par exemple 
le nombre tt(x) de nombres premier sp x 
ou le nombre U(n) des solutions de l’équa- 


tion x\ + x$ — n en nombres entiers. 
Depuis 1830, on a imaginé, pour résoudre 
ces questions, des méthodes d’une extraor- 
dinaire ingéniosité qui consistent à associer 
aux fonctions arithmétiques étudiées des 
fonctions analytiques auxquelles on peut 
appliquer la théorie de Cauchy ou l’analyse 
harmonique ; mais, malgré les succès spec- 
taculaires obtenus par ces méthodes, on ne 
peut dire que l’on en comprenne vraiment 
les raisons profondes. 

1 . La théorie additive 

Le point de vue formel 
Un monoïde est un ensemble M où est défi- 
nie une loi de composition (s, /) »— *■ St qui est 
associative et possède un élément neutre e 
(autrement dit es = se = s pour tout 
S G M) ; les groupes sont évidemment des 
monoïdes ; d’autres exemples importants 
sont formés par l’ensemble N des entiers 
^ 0, avec pour loi l’addition, et l’ensem- 
ble N* des entiers > 0, avec pour loi la mul- 
tiplication. Étant donné un corps commuta- 
tif K, on définit, pour tout monoïde M, 
Y algèbre K[M] du monoïde M sur K de la 
façon suivante : on définit l’espace vecto- 
riel K[M] à l’aide d’une hase (u s ), dite cano- 
nique, où l’ensemble d’indices est M ; puis 
on prend pour table de multiplication de 
cette base u s U t = M v/ , quels que soient S et t 
dans M ; on vérifie qu’on a bien défini ainsi 
une algèbre associative dont l’élément unité 
est u e . Tout élément A' G K[M] s’écrit d’une 
seule manière : 



avec ^ C K et t, s = 0 sauf pour un nombre 
fini de valeurs de s G M ; il revient au 
même de dire que K[M] est formé des 
familles (Ç s ), s G M, d’éléments de K, 
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indexées par M, telles que c, s = 0 sauf pour 
un nombre fini d’éléments de M ; l’addi- 
tion se fait composante par composante et 
la multiplication est définie par : 

(1) On,) = O 

avec : 

(2) ç s = ^ n„, 

vw = s 

somme qui a un sens dans K, puisqu’elle 
n’a qu’un nombre fini de termes ^ 0. 

Remarquons maintenant que, si l’on ne 
fait aucune hypothèse sur les familles (£ y ) et 
(f| ç ), le second membre de (2) a encore un 
sens si le monoïde M satisfait à la condition : 
(D) Pour tout s G M, il n’existe qu’un 
nombre fini de couples (v, w) d’éléments de 
M tels que VW = S. 

Par exemple, les monoïdes N et N* 
définis ci-dessus vérifient (D). Pour un tel 
monoïde, on définit donc sur l’espace 
vectoriel K[[M]] de toutes les familles (t^), 
S G M, une structure d’algèbre par les 
formules (1) et (2) ; on dit que cette algèbre 
est Y algèbre large du monoïde M. 

Lorsque M = N, K[[N]] n’est autre 
que l’algèbre des séries formelles à une 
indéterminée : si l’on pose u j = X, on a 
U n = X n pour tout entier n ^ 1 ; au lieu 
d’écrire (£„), n G N, les éléments de cette 
algèbre, on convient de les noter : 



la loi de multiplication (2) donnant alors la 
formule usuelle : 


< r > (5> x ")( É n ” x ") 


n = 0 n - 0 


t<Z 

R = 0 p + q - n 


x" 


du produit de séries entières. On note 
encore cette algèbre K[[X]]. Elle contient 
évidemment l’algèbre des polynômes 
K[X] ; en outre, pour qu’une série for- 
melle : 


Ê„X* 

ait un inverse dans K[[X]], il faut et il suffit 
que Çq 0 . Les fractions rationnelles 
P(X)/Q(X) telles que Q( 0 ) 7^ 0 sont donc 
des éléments de K[[X]] ; en particulier, on 
a : 

( 3 ) -j-L_ = l + x+ XZ + +X- + 

L’ordre a )(/) d’une série formelle : 

00 

/(X) = ^ e„x" 
nTQ 

non nulle est le plus petit exposant n tel que 
7^ 0 . Soit (f n ) une suite de séries for- 
melles telle que l’ordre (j)(J n ) tende vers 
•f- 00 avec n. Alors, on peut définir dans 
K[[X]] la somme infinie : 

( 4 ) f\ -Y fl + +fn + 
et le produit infini : 

(5) (1 +/ 1 XI +/ 2 MI +/.)... 

de la façon suivante. Pour tout entier m, il 
existe un entier N(m) tendant vers -|~ 00 
avec m tel que, dans la somme fi -j- 
fl + + f n , resp. le produit 
(1 + /i)---(l ~hfn)t tous l es termes de 
degrés ^ m soient les mêmes dès que 
n ^ N(/ 77 ). Il y a donc une série formelle 
/?(X) et une seule telle que, pour tout entier 
m , les termes de degrés ^ m dans h(X) 
soient les mêmes que ceux des sommes 
f\ ~\~fl “h ^sp. des produits 

(1 +/i)-(l -\-fn)y pour tout 7 1 ^ N(m) ; 
c’est cette série qui, par définition, est la 


1 

n = 0 
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somme infinie (4), resp. le produit 
infini (5). Cette définition justifie, pour une 
série formelle, l’écriture : 

n = 0 

On supposera toujours par la suite 
que K est le corps C des nombres com- 
plexes ; si (£ fl ) est une suite de nombres 
complexes, on dit souvent que la série 
formelle : 

n = 0 

est la série génératrice de la suite (£ n ). Cela 
étant, des propriétés d’une suite (£ w ) on 
peut souvent déduire une expression de la 
série génératrice sous une autre forme qui 
permet d’obtenir des relations entre (£ rt ) et 
d’autres suites. 

Exemples 

Désignons par t, n le nombre de solutions en 
entiers ^ 0 de l’équation diophantienne à 
trois variables x + 2y -j- = n. En rai- 

son de (3), la série génératrice : 



est égale à : 

1 

(1 — X)(l — X 2 )(l — X 3 ) 

Si l’on décompose cette fraction ration- 
nelle en éléments simples, on obtient : 

1 1 17 

6(1 — X) 3 + 4(1— X) 2 + 72(1— X) 

1 1 1 
+ 8(1 + X) + 9(1 —JX) + 9(1 — y 2 X)’ 

où j désigne la racine cubique de l’unité 
exp (2 70/3) ; utilisant de nouveau (3) ainsi 
que les formules analogues pour 1 /( 1 


X)*, qui s’obtiennent en dérivant un nom- 
bre quelconque de fois les deux membres 
de (3), on obtient aisément l’expression de 
comme l’entier le plus proche de 
(n + 3) 2 /12. 

Plus généralement, soit flj, (l^ . . . .a, des 
entiers > 0, sans diviseur commun ^ 1, et 
notons E, n le nombre de solutions en entiers 
) 0 de l’équation à r inconnues : 

( 6 ) <*!*!+ a 2 x 2 + + a r x r = n . 

On voit que la série génératrice corres- 
pondante est : 

(1 — X*i)(l — X fl 0 (1 — X fl ô 

La décomposition de cette fraction 
rationnelle en éléments simples donne 
encore t, n ; si l’on ne cherche qu’une partie 
principale de on constate aisément 
qu’elle provient du pôle d’ordre le plus 
élevé, c’est-à-dire le point 1, et l’on trouve : 

n r -'/(a : a 2 ...a r (r — 1)!)- 

Sommes d e cariés 

Il peut se faire que la série génératrice 
d’une suite (£ #I ) de nombres complexes 
fournisse une série entière convergente 
dans un voisinage de : = 0 lorsqu’on y 
substitue à l’indéterminée X un nombre 
complexe z. Des propriétés de la fonction 
analytique f{z) égale à la somme de cette 
série entière, on peut alors déduire des 
renseignements sur la valeur de £ /r 

Les premiers exemples de cette 
méthode ont été donnés par Jacob i à l’aide 
de sa théorie des fonctions elliptiques, 
pour le problème consistant à chercher le 
nombre de solutions en nombres entiers 
(positifs ou négatifs) de l’équation à / 
inconnues : 

(7) x\ -f x\ + ... + x) = n. 
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Ce nombre est le coefficient de z n dans 
le développement en série entière de la 
fonction (/ (z))', où : 

( 8 ) 


série entière qui converge pour z < 1. Or 
f(z) est une des « fonctions thêta » de la 
théorie des fonctions elliptiques, et certai- 
nes de ses puissances s’expriment par 
d’autres développements en série qui four- 
nissent le nombre de solutions de (7). 

Par exemple, pour r — 2, on a : 


(f(z)Y = 1 + 4 £ 

n — 1 


Z n 

1 + Z ln 


-'+‘Z 

« = 1 


z" — z 3 " 


1 — Z 4 « 


d’où l’on déduit que le nombre U(n) 
de solutions de x\ + x$ = n est quatre 
fois la différence entre le nombre des 
diviseurs de n de lu forme 4k 1 et le 
nombre des diviseur .- de n de la forme 
4k + 3. 

De même, pour r — 4, on a la formule : 


Il convient de noter ici qu’il y a des 
formules explicites pour le nombre de 
solutions de (7) pour r ^ 8 qui se dédui- 
sent de la théorie générale des formes 
quadratiques à coefficients entiers, cette 
théorie « expliquant » aussi l’absence de 
telles formules pour y > 8 (cf. formes 
QUADRATIQUES). 

Partitions 

Le « nombre de partitions » p(n) d’un 
entier n ^ 1 est par définition le nombre 
de solutions en entiers ^ 0 de l’équation : 

(9) A] + 2a 2 "b 3 a 3 + + tnx m + •). = n, 

où le nombre d’inconnues jt n’est pas 
limité (mais, pour un ri donné, il est clair 
qu’on a nécessairement x m = 0 pour tout 
m > n). Ce nombre peut aussi être défini 
comme le nombre des classes d’équiva- 
lence des partition d’un ensemble de n 
éléments, lorsqu’on range dans une même 
classe deux partitions qui se déduisent 
l’une de l’autre par une permutation de 
l’ensemble. Il est immédiat que la série 
génératrice converge pour | z < 1 et est 
donnée par : 


/(z) 4 =1 + 8 


/ z ^ 

V 1 — z 1 


2z2 3 z 3 

+ 1 


+ Z 2 


-) 


= 1 + 8 o l (m)(z m + 3 z lm 

m 

+ 3 z 4m + 3z 8m + . 


où m parcourt l’ensemble des nombres 
impairs > 1 et où (jj (m) désigne la somme 
des diviseurs de m. On en conclut que, si 
l’on pose n = 2a m, où m est impair, le 
nombre de solutions de : 


x]+x\ + x\ + x\ = n 

est 8 Gj (m) si a = 0 et 24 cjj (m) si a > 0 ; 
en particulier ce nombre est toujours 1 
(théorème de Lagrange). 


<X DO 

(10) F(z) - \'p(n)z' t = (1 —z" 1 )- 1 . 

" 0 m = 1 

L’idée fondamentale est d’exprimer le 
coefficient p(n) à l’aide de la formule de 
Cauchy : 


( 11 ) 


Pin) = 


2 ni 


Je x ” +l 


dx, 


où C est un cercle de centre 0 et de rayon 
y < 1 ; le problème est d’évaluer cette 
intégrale lorsque r est pris voisin de 1. On 
utilise le fait que F(z) est liée à une 
« fonction modulaire » q (t) par la for- 
mule : 


(12) F(<?2**)= 
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où î est un nombre complexe de partie 
imaginaire strictement positive. La pro- 
priété essentielle de cette fonction f| est la 
formule de transformation : 

(13) n(s- 1)= efct + dy n r\(t), 
pour toute transformation modulaire : 

at + b 

(14) s: ‘~âTd’ 

où <7, b , c, d sont des entiers tels que 
ad bc = 1 et où E s est une racine 24-ième 
de l’unité, déterminée explicitement en 
fonction de a, c, d. Comme il est 
immédiat que z = 1 est un point singulier 
de la fonction F, il en est de même, en vertu 
de (12) et (13), de tout point «rationnel » 
sur le cercle unité, c’est-à-dire de la forme 
exp (2mh/k) où h et k sont des entiers 
premiers entre eux. La méthode extrême- 
ment ingénieuse de Hardy-Ramanujan, 
perfectionnée par Rademacher, consiste à 
faire intervenir les contributions de ces 
points singuliers dans l’intégrale (1 1), en 
divisant le cercle C en arcs partiels dont 
chacun est « voisin » d’un tel point. De 
façon précise, pour tout entier N, on 
considère l’intégrale (11) étendue au cer- 
cle C de rayon exp (— 27T/N 2 ). On range en 
une suite croissante les fractions h/k à 
termes premiers entre eux et tels que 
0 h k ^ N (suite de Farey d’ordre 
N). La théorie élémentaire de la suite de 
Farey conduit, pour trois fractions consé- 
cutives \ï /k! < h/k < h" /k" , à « isoler » 
la fraction centrale par l’intervalle 1^ 
d’extrémités : 

h + h' h+h" , 

k+k ’ 7 k + k ,r> 

on démontre que ces extrémités s’écrivent 

aussi : 

h 1 h î 

k~ k(k + k')’ k k(k+k")’ 


les longueurs : 

L 1 L 1 

1 = k(k + K)’ 2 “ k(k + kV 

étant donc bornées par : 

*(2N— 1) * Li * k(N +T)’ 

pour i = 1, 2, ce qui permet les majora- 
tions ultérieures. À ces intervalles corres- 
pondent sur le cercle C les arcs de la 
« dissection de Farey » définis par : 

* = exp(— ^ + 2ine), eei M . 

Utilisant (14), on est conduit à rempla- 
cer dans l’intégrale : 

r F(x)x- n ~ l dx 

rh,k 

la fonction F(x) par l’expression : 
*>*,*¥“*(*)» 

avec : 



de sorte que : 



où cp varie de — L 2 à L„ où V I^ est la 
fonction « élémentaire » : 

n(z)=z^exp( ï ^( 2 1 -z)) ) 

et enfin où 0)/,^ est la racine 24-ième de 
l’unité définie par : 

= exp(ïï/S (h, k)) 9 

avec : 
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Un calcul assez élémentaire de majo- 
ration montre que, lorsqu’on fait ces 
substitutions dans les diverses intégrales 
étendues aux arcs l’erreur totale com- 
mise est 0(N - ^ 2 ). Il reste à évaluer les 
intégrales : 

cela se fait à l’aide d’une utilisation très 
ingénieuse de la théorie de Cauchy et 
conduit finalement au remarquable résul- 
tat suivant obtenu par H. Rademacher 
(1937). Le nombre p(n) s’exprime par une 
série convergente : 

k = 1 

où sh désigne le sinus hyperbolique, ou 
c = ttV 2/3 , où : 

A*(rc) = ^ exp (—2 mnh/k), 

<M)= 1 

h parcourant l’ensemble des entiers < k 
premiers à k, et enfin où : 



on peut obtenir des majorations commo- 
des du reste de cette série en fonction de 
M lorsqu’on ne considère que les M 
premiers termes. Pour obtenir la valeur de 
p(n), il suffit évidemment de prendre M tel 
que ce reste soit en valeur absolue <1/2 
puisque p(n) est un entier. Par exemple, 
pour n = 72 1, il suffit de prendre M = 2 1, 
et l’on trouve : 

p (721) = 161061755750279477635534762. 

De plus, chacun des termes de la série 
(15), considéré comme fonction de n , est 
négligeable devant le précédent ; en parti- 


culier, on a la partie principale (résultat dû 
à G. H. Hardy et à S. Ramanujan) : 

(16) / ’ ( " ) ~4?!ïï exp ( ,r Vf" ,/2 )’ n ~°°‘ 

Signalons encore que la formule (10) a 
permis à Ramanujan, en se plaçant au 
point de vue formel, d’obtenir des pro- 
priétés arithmétiques intéressantes des 
nombres p(n) ; par exemple, on a les 
congruences : 

p(5n + 4)= 0 (mod 5), 
p (In + 5) = 0 (mod 7), 
p (25 n + 24) =0 (mod 25). 

Le problème de Waring 

Le théorème de Lagrange sur la possibilité 
d’écrire tout entier comme somme de 
quatre carrés au plus a conduit en 1792 le 
mathématicien anglais E. Waring à avan- 
cer la conjecture que, pour tout exposant 
entier k ^ 2, il existe un entier g(k) tel que 
l’équation : 

(17) x\ + x\ + +x£ (fc ) = n 

possède au moins une solution en nombres 
entiers, quel que soit l’entier n ^ 0. La 
première démonstration de cette conjec- 
ture fut donnée par Hilbert en 1909 ; on 
dispose actuellement de méthodes beau- 
coup plus puissantes, dues à G. H. Hardy, 
à J. E. Littlewood et à I. M. Vinogradov et 
qui non seulement prouvent la conjecture 
de Waring avec une bonne estimation de 
g(k), mais encore donnent une estimation 
approchée du nombre de solutions de (17) 
en nombres entiers. L’idée de Hardy et de 
Littlewood est de généraliser la méthode 
de Jacobi en considérant la fonction : 

/(z) = £ Z"*, 

m - 0 
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série entière convergente pour Z < 1. Le 
nombre de solutions de : 

(18) +*;=* 

en entiers ^ 0 est donc donné, comme 
dans (1 1), par la formule de Cauchy : 

(19) r ° ( ” ) = 2ÎfJc W^yx—'àx, 

l’intégrale étant étendue à un cercle de cen- 
tre 0 et de rayon r < 1. La fonctionfn’aici 
aucune propriété analogue à (12) et (13), 
mais r = 1 en est évidemment un point sin- 
gulier, et des considérations heuristiques 
montrent qu’il en est encore de même de 
tout point « rationnel » exp (2ltip/q), la 
« contribution » d’un tel point dans l’inté- 
grale (18) étant d’autant plus importante 
que q est plus petit. La méthode de Hardy- 
Littlewood consiste à décomposer encore le 
cercle C en arcs partiels centrés aux points 
correspondant à une suite de Farey ; on ne 
peut plus ici obtenir de majoration com- 
mode pour les arcs ^ tout entiers ; il faut 
les restreindre d’une certaine manière, obte- 
nant ce qu’on appelle les « major ÜVCS » ; 
leur contribution donne la partie principale 
de r$(n) ; mais, pour le prouver, il faut majo- 
rer la contribution des arcs restants de C 
(« minor arcs »). Les calculs de majoration 
et d’approximation sont ici beaucoup plus 
difficiles que pour le problème des parti- 
tions. 

On peut, avec Vinogradov, présenter 
cette méthode d’une manière un peu dif- 
férente ; pour un n donné, on a évidem- 
ment | Xj | ^ P = \n llk ] pour 1 ^ j ^ s 
pour toute solution de (18) ; il n’y a donc 
pas lieu de faire intervenir les exposants 
m k > n dans la série /(r), ce qui conduit 
à remplacer f par le polynôme : 


p 



m = 1 


et permet, dans (19), de prendre pour C 
le cercle z = 1 lui-même. D’autre part, 
il n’y a pas intérêt à tenir compte des 
valeurs x } = 0 dans les solutions de (18) ; 
finalement, si l’on note r(n) le nombre 
de solutions de (18) pour lesquelles A) 
^ 1 pour tout y, on obtient l’expres- 
sion : 

(20) r(n) = J 1 (h(x)) s e— 2ninx dx, 

où ; 

h ( x ) = ^ e 2Kim * x . 

m = 1 

Pour traiter cette intégrale, Vinogradov 
retient le principe de la méthode de Hardy- 
Littlewood, en divisant l’intervalle [0, 1] en 
« major arcs » et « minor arcs » liés aux 
suites de Farey ; mais il utilise, en outre, 
pour majorer la contribution des « minor 
arcs », une méthode nouvelle, beaucoup 
plus puissante que la méthode de H. Weyl 
qu’avaient appliquée à cette fin Hardy et 
Littlewood. 

Les résultats sont les suivants : 

a) La contribution des « major arcs » 
fait intervenir la fonction gamma ; elle est 
de la forme : 

( r (i + LV 

(21) 7 v " é(n,s)n s/k ~ l + 

r (ri 

où (§ (tf, 5) est un nombre dépendant de n , 
S et k, mais restant borné lorsque n varie de 
1 a ) x, 5 et k restant fixes. Ce nombre, 
dit « série singulière de Hardy- 
Littlewood », s’obtient de la façon sui- 
vante. Pour tout entier q > 1, on pose : 

? 

S (a, q) = 1 exp (2 m m k a/q), 

m = 0 
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pour tout entier Q tel que 1 ^ a ^ q 1 . 
premier à q ; on pose ensuite : 

A (q ) = q ~ s (S (a , q )) s exp( — 2 nina/q ). 

= 1 

la somme s’étendant aux entiers a précé- 
dents, et enfin : 

* 

<§(rt,s) = ^ A (q); 

q = 1 

on prouve que la série est absolument 
convergente pour s ^ 2k -J- 1 et que, pour 
S ^ 4/l , il y a un nombre c > 0 tel que 
Q(n, s) c pour tout entier n. 

b) Hardy et Littlewood prouvent que, 
pour s ^ (k — 2)2 A_ 1 H— 5, la contribution 
des « minor arcs » est o(n^ k ~ l ), et Vino- 
gradov obtient le même résultat en sup- 
posant seulement que k ^ 12 et s ^ 
10 A: 2 ln k. Si l’on désigne par G(k) le plus 
petit nombre tel que, pour s ^ G(k), 
l’équation (18) ait des solutions dès que n 
est supérieur à un entier n,(k) dépendant 
de k, on voit donc que, pour k ^ 12, on 
a G(k) ^ 1 OÆ 2 lnÆ, et la partie principale 
de r(n), lorsque n tend vers + x, est 
donnée par le premier terme de (21) dès 
que S ^ 10 k 2 ln k. En fait, par un raffi- 
nement de ses méthodes, Yinogradov a 
pu montrer que l’on a l’inégalité 
G(k) ^ k (3 ln k + 1 1), sans peut-être, 
alors, que la partie principale de r(n) soit 
donnée par (21). 

C’) On montre aisément que 
G(k) ^ k + 1 et on conjecture que 
G(k)/k est borné. On a G(2) = 4 par le 
théorème de Lagrange, les nombres de la 
forme 8 m + 7 ne pouvant être somme de 
trois carrés ; Davenport a prouvé que 
G(4) = 16. Pour les autres valeurs de k, on 
n’a que des majorations pour G, obtenues 
par des procédés particuliers : G(3) ^ 7, 
G(5) ^ 23. 


Le nombre g(k) intervenant dans la 
formulation originale du problème de 
Waring a pu, grâce aux travaux de Vino- 
gradov, être complètement déterminé, 
sauf pour k = 4 et k = 5 ; il est toujours 
au moins égal à 2 k — 2 + [(3/2)*] et est 
égal à ce nombre, sauf pour un nombre fini 
d’exposants k. On a : 

g( 3) =9, 19 a g( 4) < 35, 

37 < g(5) < 54 , g(6) = 73. 

Le problème de Goldbach 

Sans doute sur la base d’essais numériques, 
un contemporain d’Euler, C. Goldbach, 
avait émis en 1742 la conjecture que tout 
entier pair est somme de deux nombres 
premiers et tout entier impair somme de 
trois nombres premiers. Aucune de ces 
deux conjectures n’est encore complète- 
ment démontrée, mais Vinogradov a pu 
établir en 1937 que tout nombre impair 
ÜSSCZ grand est somme de trois nombres 
premiers. Si l’on pose : 

( 22 ) f(x y n ) = exp (2 mpx ), 

où la somme est étendue à tous les 
nombres premiers p ^ fl, le nombre de 
solutions de l’équation p | -|- /b Pj = fl 
en nombres premiers est donné par : 

(23) r(n) = f*° + 1 (/ (x,« )) 3 exp( — 2 ninx ) dx , 

Jx 0 

pour un x 0 réel quelconque. L’évaluation 
de cette intégrale se fait encore en suivant 
l’idée de la méthode de Hardy-Littlewood ; 
on prend x 0 = fl -1 ln 15 fl et, dans l’inter- 
valle [a 0 , Xq + 1], les « major arcs » sont 
les intervalles centrés aux points h/q (où 
q ^ ln 15 fl, 0 < h < q, h premier à q) et de 
demi-longueur Jq. Si E, est le complémen- 
taire de la réunion de ces intervalles, 
Vinogradov commence par prouver, par 
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une ingénieuse et longue succession de 
majorations de nature élémentaire (n’uti- 
lisant même pas le théorème des nombres 
premiers), que l’on a : 


(24) j (f(x,n )) 3 exp( — 2 ninx ) dx | 

< Cn 2 \n— 4 tî, 

où C est une constante. La partie profonde 
du raisonnement est l’évaluation de 
f(x, ni) pour Wl n et pour x dans un 
« major arc », c’est-à-dire x = ( h/q ) + y 
où q et h sont comme ci-dessus et où 
y <C Xq. L’idée essentielle est de remar- 
quer que, dans la somme : 


/( 



^ ' exp (2 niph/q ), 

p ^ m 


si l’on ne considère que les nombres 
premiers ne divisant pas q, l’erreur com- 
mise en valeur absolue est au plus q, Mais 
la somme restante s’écrit alors : 


Autrement dit, on a remplacé la som- 
mation sur les nombres premiers ^ m par 
une sommation sur tous les entiers ^ m , 
beaucoup plus maniable. En particulier, si 
l’on pose : 

P («) = f' /2 (g(y,n)ycxp(—2mny)dy, 

J— 1/2 

on montre élémentairement que l’on a : 

(27) ^ « 2 ln— 3 n < p(n) < « 2 ; 

d’autre part, on introduit, pour tout entier 
q, la somme : 

(28) c q (n) = \ exp ( — 2 ninh/q ) ; 

ü < h < ç,(n,q) = 1 

on montre que la série : 

X 

(29) S(n) = £ 

? = 1 

est absolument convergente et que l’on a : 


y exp (2 t liih/q) ir(m ; q, /), 

0 < / <q 
(/.*> = 1 


où Tt(m ; q, î) est le nombre de nombres 
premiers p ^ m qui appartiennent à la 
progression arithmétique des nombres 
kq + l (k entier arbitraire). En utilisant 
(cf. Le théorème de lu progression arith- 
métique , in chap. 2) la forme la plus 
précise connue de l’estimation asymptoti- 
que de TT (m ; q, /), on parvient alors à 


l’inégalité 


( 2 5) \/( h -+y, n )-^ g ^n) 


<«ln- 69 «, 


où M est la fonction de Mobius, (p la 
fonction d’Euler et où : 


m 

(26)g(*, m) = £ — 


exp (2 7 vikx ). 


tm w = n('-ï^> 

p 

où le produit est étendu à tous les nombres 
premiers ; cela donne S(/7) = 0 pour n 
pair, et on montre aisément que S(n) ^ 1 
pour n impair. On déduit alors de (23). (24) 
et (25) l’inégalité : 

|r(/î) — S(«)p(w)| ^ Cn 2 \n~ 4 n, 

ce qui, joint à (27), prouve que r(n) ^ 1 
pour n assez grand. 


2. La théorie multiplicative 

Le point de vue formel 
On a vu supra (cf. Le point de vue forme ! , 
in chap. 1) que le monoïde multiplicatif 
N * vérifie la condition (D), et qu’on peut 
donc définir son algèbre large sur un corps 
K ; on se bornera encore au cas où K = C, 
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et on notera D cette algèbre large. On note 
ici n~ iù l’élément U n de la base canonique de 
C[N*], et cette fois, un élément /£ D se 
note : 

n = 1 

et on dit que c’est une série formelle de 
Dirichlet. Le produit de deux élémentsfet 
g de D se note aussi /* g et est défini par : 

(31) if *g){n) = ^>*(0, 

qr — n 

ce qui s’écrit encore : 

(32) ( ÿV(n )«-“)( 

n — 1 n = 1 

= Z(Z /(?)g(r) )”““ 

n = 1 qr = n 

Pour qu’une série formelle de Dirich- 
let : 

n = 1 

ait un inverse dans D, il faut et il suffit que 
/( 1) ^ 0. L’ordre d’ une série formelle de 
Dirichlet : 

oc 

£/<»>»- 

n = 1 

non nulle est encore défini comme le plus 
petit entier n tel que fin) ^ 0. On voit 
qu’on peut encore définir dans D la somme 
infinie (4) et le produit infini (5) lorsque 
l’ordre d e/„ tend vers + oo avec n , Si on 
convient d’écrire F(o) une série formelle 
de Dirichlet : 


on écrit alors F (w + a), pour tout nom- 
bre complexe a, la série formelle de 
Dirichlet : 

K 

JVo»*-»)#-; 

n = 1 

de même, on écrit F (ko), pour tout entier 
k, la série formelle de Dirichlet : 

if (n k )n — ' “ 

et F’(o) la série formelle de Dirichlet : 

w 

£ (— /(K)ln«)«-“. 

n = 1 

La décomposition d’un entier en fac- 
teurs premiers exprime encore que le 
monoïde multiplicatif N* est « produit 
direct » d’une infinité de monoïdes iso- 
morphes au monoïde additif N. Dans la 
théorie des séries formelles de Dirichlet, ce 
fait apparaît de la manière suivante. Rap 
pelons qu’une fonctionfdéfinie dans N*, 
à valeurs complexes, est dite multiplicative 
si l’on a /(D = 1 et fimn) —f(m)fin) pour 
deux entilrf f# ^frs entre eux (cf. 

DM9BU1É) On V vl I I I V aisément que, si f 
et g sont multiplicatives, il en est de même 
de/ * g et de l’inverse defdans D. Lorsque 
f est multiplicative, on a la décomposition 
en produit infini (produit étendu à tous les 
nombres premiers p ) de la série formelle de 
Dirichlet : 

( 33 ) F(o) = ^/(«)«-“ 

n = 1 

= r | (1 +/(^) J p- w +-../(p A )(p A )” w +--) 

p 

qui équivaut à la décomposition fin) = 
f (P\ *•) . . . f (p r kr ) pour la décomposition de 
n en facteurs premiers n — pfl . . . p r kr . 
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Rappelons (cf. divisibilité) que la fonc- 
tion constante i : n 1, la fonction de 
Mobius ju, la fonction d’Euler cp } la fonction 
U *- ► d(n), où d(n ) est le nombre de diviseurs 
de n, et les fonctions n l— * o,(n), où o,(n) est 
la somme des puissances cc-ièmes des divi- 
seurs de n, sont multiplicatives ; il en est de 
même de la fonction n (— ► 2 V( "*, où v(n) est le 
nombre des facteurs premiers distincts de n , 
de la fonction de Liouville n ► h(n), définie 
par \(n) = (- 1) A , où k est le nombre des 
facteurs premiers de n , comptés avec leur 
ordre de multiplicité ; enfin, la fonction de 
von Mangoldt n >— ► A(n) est aussi multipli- 
cative, A(n) étant 0 si n n’est pas une puis- 
sance d’un nombre premier, égal à ln p si 
n = p m est une telle puissance. 

A ces diverses fonctions multiplicatives 
correspondent des séries formelles de Diri- 
chlet, en premier lieu la série zêta : 

(34) t(w) = V = JJ (1 _ p 

T=* l P 

et on montre que les séries formelles de 
Dirichlet correspondant aux autres fonc- 
tions multiplicatives s’expriment à l’aide 
de la série zêta par : 


(35) 

Ep(/i)n-“ = 1/Ç(w), 

(36) 

£ p(») «-* = C(u)/t(2 ü>), 

n 

(37) 

E<j )(«)/!“« = C(C0 — 1)/C(<J>), 

n 

(38) 

Zd(n)rt~“= Ç(o) 2 , 

n 

(39) 

JLa a (/i)w-« = C(w)C(o) — a). 

(40) 

Z2 *>ii-» = C(w) 2 /C(2o>), 

n 

(41) 

Z\{n)n~«= C(2<o)/t(&)), 

(42) 

Z A (*)»-«=— C'(w)/C(w). 

n 

Séries 

de Dirichlet 

L’idée 

fondamentale de la théorie 


plicative est tout à fait analogue à celle de 


la théorie additive : si, dans une série 
formelle de Dirichlet : 

^ a(n)n~“, 
n 

on remplace le symbole n~ w par le nombre 
complexe n~ s = exp (- S ln /î), où i 6 C, 
on obtient une série de nombres comple- 
xes, qui, si elle converge, a pour somme 
une fonction de S i l’application de la 
théorie de Cauchy à cette fonction dans les 
régions du plan C où cette fonction est 
analytique donnera des informations sur 
les coefficients u(n) de la série. 

On poses = (J -|- it, où (J et t sont réels, 
pour tout nombre complexe s, de sorte que 
l’on a : 

\a{n)n~ s \ = \a(n)\n~ a , 
et, par suite, si la série de Dirichlet : 

a {n)n~ s 

converge absolument pour Sj = cfi + it j, 
elle converge absolument dans le demi-plan 
Q ^ Oj ; on en déduit aussitôt qu’il existe un 
nombre réel o a (éventuellement égal à + x 
ou — oo) tel que la série converge absolu- 
ment pour Q > O a et ne converge pas abso- 
lument pour (j < o a . Mais, contrairement à 
ce qui se passe pour les séries entières, il se 
peut qu’une série de Dirichlet soit conver- 
gente sans l’être absolument dans toute une 
partie ouverte non vide du plan. De façon 
précise, on montre, par un raisonnement 
d’intégration par parties, que, si la série 
converge pour s 0 = Oq + it 0 , elle converge 
uniformément dans tout angle de sommet 
Sq, défini pars = Sq -J- pe /G , avec p ^ 0 et 
a ^ 0 ^ a, a étant un nombre quelcon- 
que tel que 0 < Q < Tr/2. De là on déduit 
aisément qu’il existe un nombre réel 
o c ^ o a tel que la série converge pour 
a > d f . et ne converge pas pour a < cr t . ; en 
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outre, on a toujours O a o c ^ 1. La fonc- 
tion : 

K 

F(s) = ^ a{n)n- s 
n = 1 

est alors holomorphe pour Œ > o ( ., et ses 
dérivées s’obtiennent en dérivant la série 
de Dirichlet terme à terme dans ce demi- 
plan. Lorsque la fonction a(n) est multi- 
plicative, la formule : 

(43) F(s) = JJ (1 + a(p)p~ s 

+ + a(p k )p~ h + ■ ■■) 

est valable pour (T > O a , le produit infini 
du second membre (dit « produit eulérietl » 
de F) étant uniformément convergent dans 
tout demi-plan (J £ pour £ > 0. 

La théorie de Cauchy ne fournit pas ici 
directement les coefficients a(n) à l’aide 
d’une intégrale curviligne, mais seulement 
les sommes de ces coefficients : 


Gauss avait même précisé cette conjecture 
en indiquant comme meilleure approxima- 
tion de 7T(x) la fonction Ii, appelée loga- 
rithme intégral : 



Le théorème des nombres premiers 
établit (46) ; démontré d’abord en 1896 
par J. Hadamard et C. de La Vallée- 
Poussin indépendamment, il a été par la 
suite amélioré par divers mathématiciens 
et l’on peut maintenant montrer que : 

(47) ix(m ) = li (m ) + 0(m exp ( — c Vin m )), 

où c > 0 est une constante. Si l’hypothèse 
de Riemann était vraie (cf. fonction ZÊTA), 
on pourrait remplacer dans (47) le terme 
complémentaire par 0(m 1/2 ln m) : on sait 
que c’est la meilleure majoration possible. 

La démonstration de (47) utilise la for- 
mule (45) appliquée à la série de Dirichlet : 


(44) 


A(m) 


=!«(")■ 

n ^ m 


On montre en effet que, pour tout 
nombre a > 0 tel que a > et tout m 
entier ^ 1, on a, pour tout T >0, 


(45) 


1 + i 

7 717 J a— i - ' 


t (m 4- 1/2) 


F(s ) ds — A(m) 
(m + 1)« + |g(*)| 


Le théorème des nombres premiers 

À la fin du XVIII e siècle, A. M. Le Gendre 
et C. F. Gauss, indépendamment, avaient 
émis la conjecture (d’après les tables de 
nombres premiers) que le nombre 7T(x) des 
nombres premiers ^ ,y avait, lorsque T 
tend vers + oo, une partie principale : 


(46) 


TTC*)- — 
\nx 


F(s) = — Ç'(s)/t(s) = A(n )n s , 

n = 1 


Si l’on pose : 

0(m ) = ln p , 


p < m 


où p parcourt les nombres premiers ^ JW, 
et A(n) = 0(ft) - on a : 


n(m) 


0(« ) — 0(« — 1) 


Y e ^)- 0 ^ 

lnn 


•E 

n = 2 

V ïn 2 + ln 3 ln m J 


1 +A(n)-A(n-1) 


lu n 


3 ln m j 

A(m) A(l) 
ln m ln 2 

m — 1 


+ X A(n) (ln« to(» + l))‘ 
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Dans cette dernière expression, la pre- 
mière somme diffère de li (m) par une 
quantité bornée. Pour prouver (47), il suffit 
donc d’établir que : 

|A(»)| ^ Cn exp( — c Vin n), 

pour deux constantes C > 0 et c > 0. 

Or, si l’on pose : 

ir(m) = y «ni 

n ^ m 

on montre élémentairement que : 

0 < ) — 0(m ) ^m ]/1 In 2 m 
et on est donc ramené à montrer que l’on a : 
U’(m)-m < cm exp( — c Vin m). 

On applique (45) en prenant : 



On sait que la fonction Ç se prolonge en 
une fonction méromorphe dans C, ayant 
un seul pôle simple au point s = 1 et ne 
s’annulant pas dans le demi-plan (J > | (cf. 
fonction ZETA) ; la série de Dirichlet F(s) 
converge absolument dans ce demi-plan, et 
l’on montre aisément à partir de (45) que 
l’on a, en posant f|(5) = (.y — l)Ç(s), 


ï’(/7i ) — m + 


1 

2Ï i 


+ /T (m+ \/l) s x\\s) ^ 

J a — /t ^ n(s) 5 

< Cm exp | — A VüTot j . 


Le point essentiel est de majorer l’inté- 
grale qui subsiste dans cette formule. La 
propriété de la fonction q(s) que l’on utilise 
pour cela est la suivante : 

Dans l’ensemble D (cf. figure, où les 
proportions ne sont pas respectées), défini 
par les inégalités : 


1 


1 

10 000 Int * 


a < 2, 


où t* = max (| t |, 100), la fonction \] ne 
s’annule pas, et l’on a l’inégalité : 


( 48 ) 


n\s) 

n (0 


<C,1 n 3 f * 


ou Ci est une constante. 

Cela s’établit à l’aide de raisonnements 
assez longs, mais élémentaires, de la théo- 
rie des fonctions holomorphes d’une varia- 
ble complexe, à partir des inégalités sui- 
vantes : 


( 49 ) 




O > 0, 5 ^ 1, 


(50) |C 3 (a)C 4 (CT + /OC(a+ 2/OI > 1, ff > 1, 

la seconde inégalité étant conséquence de 
l’observation que la partie réelle de 
3 + 4 V e -f” e 2lQ est toujours ^ 0 pour 0 
réel. 

Cela étant, on utilise (48) de la façon 
suivante. En vertu, du théorème de Cauchy 
appliqué à la fonc.,on : 

(m + 1/2 y n '(s) 

s n(s) 

holomorphe dans un voisinage ouvert 
de D, l’intégrale de cette fonction, étendue 
au segment d’extrémités a' ÎT, a" + ïT, 
est égale à l’intégrale étendue aux 
trois autres côtés du rectangle d’extré- 
mités a ± fr, 0f ± f. T, pourvu que ce rec- 
tangle soit contenu dans D (cf. figure). On 
prend : 


10 000 InT 

qui répond à la question pour m assez 
grand. Il est alors facile, en appliquant la 
majoration (48), de voir que l’on a bien : 

I |»a + rr (m + 1/2)* 

| J a — /t s nCÜ 

<C 2 mexp(-AvE^), 
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t 



pour une constante convenable C 2 , ce qui 
achève la démonstration. 

Le théorème 

de la progression arithmétique 

La méthode d’Euclide prouvant l’existence 
d’une infinité de nombres premiers peut, 
convenablement modifiée, établir par 
exemple qu’il y a une infinité de nombres 
premiers de la forme 4 fi + 3 ou de la 
forme 6 n - h 5. Le théorème de la progres- 
sion arithmétique affirme que, quels que 
soient les entiers k et / premiers entre eux, 
il y a une infinité de nombres premiers de 
la forme kn + l ; il fut démontré pour la 
première fois en 1837 par Dirichlet, qui, à 
cette occasion, introduisit à la fois dans la 
science les deux notions de série de Dirich- 
let et de caractère d’un groupe abélien fini 
(cf. GROUPES ■ Représentation linéaire des 
groupes) ; les améliorations et généralisa- 
tions de ce théorème utilisent toujours 
l’idée extrêmement originale de Dirichlet. 

La forme la plus précise du théorème de 
Dirichlet est la suivante : 

Notons JT (m ; k, î) le nombre de nom- 
bres premiers p ^ m qui sont de la forme 
kn -f- / ; le nombre 7 x(m ; 1, 1) n’est autre 


que le nombre 7 l(m) introduit plus haut. 
Alors, pour tout entier N, on peut écrire : 


( 51 ) 




C(N)m exp ( — ^ VTïTm j , 


où la constante C(N) ne dépend que de N, 
l’inégalité étant valable pour tout entier m, 
tout entier k tel que : 

(52) k < ln N m 

et tout entier 1 < k premier avec k ; (p est la 
fonction (T Euler, <p(k) étant donc le nombre 
d’entiers / tels que 1 ^ l < k, qui sont pre- 
miers avec k. La comparaison des parties 
principales de ïï(m \k, /) et de TT (m) montre 
que l’on peut encore dire que les nombres 
premiers sont « également répartis » dans 
les q(k) progressions arithmétiques kn -\- L 
L’idée fondamentale de Dirichlet est de 
considérer à lu fois ces <p(k) classes 
d’entiers et d’utiliser le fait qu’elles for- 
ment naturellement un groupe commutatif, 
savoir le groupe (Z/fcZ)* des éléments 
inversibles de l’anneau ZjkZ. 11 y a donc 
<p(k) caractères X/„ 1 Çh ^ <p(k), de ce 
groupe (à valeurs dans le groupe U des 
nombres complexes de valeur absolue 1), 
qui ici sont des homomorphismes de 
(Z/kZ)* dans U (ce qui entraîne que leurs 
valeurs sont des racines c p(k)-ièmes de 
Imité) ; rappelons que l’on a les relations 
d’orthogonalité 

*<*) , 

(53) = 

h ^1 


pour x, y dans (Z//rZ)*, 


( 54 ) ^ Xj(x)Xh(x) = { 


0 , j^h, 

% <H), j = h, 


la somme étant étendue à tous les éléments 
X de (Z//:Z)*. L’application : j — ► 1 est 
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un caractère dit principal et, pour tout 
caractère non principal x> on a, d’après 

(54) , 

^ X(X) = 0. 

A partir de ces caractères de (Z//rZ)*, on 
définit sur Z des fonctions y\n) dits « carac- 
tères modulo k » en prenant %(n) égal à x(x) 
où x est la classe de n (mod k) si (n, k) = 1, 
et yX n ) = 0 si (n. k) # 1. On vérifie aussi- 
tôt que X( mn ) = X( m )X( n ) c l uels q ue soient 
les entiers m et n ; le « caractère principal 
modulo k » est la fonction égale à 1 pour 
(/?, k) = 1, à 0 sinon. 

Cela étant, on peut écrire : 

K{m ; k, /) = y 1 g(p), 

p çm 

où p parcourt l’ensemble des nombres 
premiers m et g(n) = 1 si n = / (mod 
k), g(n) = 0 sinon. Or. en raison des 
relations d’orthogonalité (53), on peut 
écrire : 

l m 

(55) g(n) = W) X 

h = 1 

d’où : 

<K*) 

(56) t ;k,l) = ^ XhiWm ; % h ), 

h = î 

où l’on a posé : 

(57) ir("» ;*/,)= ^ Xh(pl 

P ^ m 

Si Xi es t le caractère principal modulo 
k, on a d’autre part : 

(58) 1 7T(m) — ir(m ; x,) | ^ qp(*>, 

pour k ^ m ; en vertu du théorème des 
nombres premiers sous la forme (47), on 


voit que, pour établir (51), il suffit de 
montrer que l’on a : 

K( w ;Z/.)I < C,(N)mexp( — 

pour h = 2,3, q(k) et k ^ ln N w. 

La marche suivie est analogue à celle du 
théorème des nombres premiers, en rem- 
plaçant la fonction Ç(.î) par les « fonc- 
tions L » de Dirichlet : 

(59) L(s> x) = ^ X(»)« -5 

n ~ 1 _ 

= Il 0 — x(p)p~ s )~'< 

définies pour chaque k et chaque « carac- 
tère modulo k » X- Il suffit de se borner aux 
caractères non principaux ; on montre 
alors aisément que la série de Dirichlet (59) 
converge dans le demi-plan a > 0 (contrai- 
rement à ce qui se passe pour un caractère 
principal) et que l’on a dans ce demi-plan 
l’inégalité analogue à (49) : 

( 60 ) \L(s,x)\^k\s\/o, 

si x est un caractère modulo k. 

La difficulté est d’obtenir une inégalité 
analogue à (48) pour la dérivée logarithmi- 
que L'(*s, X,)/ L(j, X) dans un domaine D N 
analogue au domaine D considéré dans la 
figure supra, mais dépendant de N ainsi que 
la constante Cp l’inégalité devant être satis- 
faite pour toiles caractères non principaux 
modulo k et tous les entiers k vérifiant (52). 
Le point capital est de montrer que les 
L (5, x) ne s’annulent pas dans un tel 
domaine D N ; on y parvient assez facile- 
ment pour les points d’un tel domaine non 
situés sur l’axe réel en utilisant des inégalités 
analogues à (50) pour les fonctions L. On 
prouve aussi (comme l’avait déjà fait Diri- 
chlet) que L( 1, x) 7 ^ 0 pour tout caractère 
non principal, ce qui permet d’obtenir (5 1) 
pour un k fixé. Pour avoir la forme générale 
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de (5 1), il faut faire appel à un résultat plus 
profond, démontré par C. L. Siegel en 
1936 : Pour tout 6 > 0, il y a un entier A(s) 
tel que, pour tout k ^ A(e) et tout caractère 
non principal x modulo k , on ait 
L(j, x) ^ 0 pour 1 — k~ E < s < 1 . 

Mentionnons ici un résultat démontré 
par Y. Linnik au moyen d’autres métho- 
des : le plus petit nombre premier appar- 
tenant à une progression arithmétique 
kn + /, pour k et 1 premiers entre eux, est 
majoré par k c \ où c est une constante. 

Le nombre de classes d’idéaux 
d’un corps quadratique 

Les résultats précédents peuvent se géné- 
raliser aux idéaux premiers d’un corps de 
nombres algébriques, grâce à l’extension à 
ces corps des définitions de la fonction zêta 
et des fonctions L. Nous ne mentionnerons 
ici qu’un cas particulier des résultats de 
cette théorie, le lien découvert par Dirich- 
let entre les fonctions L et le nombre de 
classes d’idéaux d’un corps quadratique. 
De façon précise, le discriminant d d’un 
corps quadratique est non divisible par un 
carré ^ 4, et est ou multiple de 4, ou de 
la forme 4 k 1 ; pour tout entier impair 
n > 1, on désigne par (-) le symbole de 
Jacobi (cf. divisibilité) si d et n sont 
premiers entre eux, 0 sinon ; on définit 
(y) comme égal à 1 si d = I (mod 8), à — 1 
si d = 1 (mod. 8), et à 0 dans les autres 

cas ; on montre alors que n ^ (^) est un 
caractère non principal modulo d |, et on 
peut donc former la série correspondante : 

L '«-i (»)"-• 

n ~ 1 

et la formule découverte par Dirichlet pour 
le nombre de classes h(d) du corps qua- 
dratique de discriminant d est : 

( 61 ) L rf (l) = ah(d). 


où a = t r/V[Zj si d < — 4, a = tt/ 3VT 
pour d = 3, a = 7T/4 pour d = —4 et 

a = 2 ln £^/V77 si d > 0, 6^ étant |’« unité 
fondamentale » du corps. C’est à l’aide de 
cette formule que Dirichlet prouva que 
L( 1, x) 7^ 0 pour tout caractère non prin- 
cipal. 

L’application la plus intéressante de la 
formule (61) a été donnée par Siegel ; une 
des formes de son théorème cité plus haut 
implique que : 

L</(1) = o(ln|</|), 

lorsque d tend vers + oo ; on en déduit, 
par (61), 

(62) \nh(d) ~ 1/2 ln \d\, 

lorsque d tend vers — oo, et : 

(63) \n(h{d)\m d )~\/2\nd, 

lorsque d tend vers -j- oo. 

L’équivalence (62) prouve entre autres 
une conjecture de Gauss, selon laquelle 
h(d) croît indéfiniment lorsque d tend vers 
— oo (conjecture démontrée d’abord par 
H. Heilbronn). En particulier, il n’y a 
qu’un nombre fini de corps quadratiques 
de discriminant d < 0 dont le nombre de 
classes d’idéaux est donné ; pour h(d) = 1, 
on sait, d’après Stark et Baker (1966), que 
les seuls corps quadratiques correspondent 
aux valeurs — 3, — 4, — 7, — 8, — 1 1, — 19, 
43, 67 et 163 de d. 

3. Valeurs moyennes 
de fonctions arithmétiques 

L’irrégularité 

des fonctions arithmétiques 
Les fonctions définies dans l’ensemble des 
entiers > 0 par des conditions de nature 
arithmétique, telieslesfonctions multiplica- 
tives qu’on a étudiées plus haut (cf. chap. 2, 
Le point de vue formel), ont une allure en 
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général très irrégulière. Par exemple, la 
fonction d(n) est égale à 2 pour n premier, 
mais elle est très grande pour les nombres de 
la forme m ! ; on peut montrer par des pro- 
cédés élémentaires (n’utilisant pas le théo- 
rème des nombres premiers) que l’on a : 

(64) lim sup = ln 2. 

n —+ oc mn 

Pour Oi(tf), l’irrégularité est moins pro- 
noncée ; on a o,(n) = n + 1 si n est 
premier, et on montre (à l’aide du théo- 
rème des nombres premiers) que : 

(65) lim sup ^ = e r, 

où y est la constante d’Euler (cf. fonction 
gamma) . De même, pour la fonction 
d’Euler <p(n), on a cp(tf) = n( 1 — \/p) pour 
n = p k , puissance d’un nombre premier, 
ce qui entraîne : 

r <p(«) i. 

lim sup = 1 , 

“ n 

on montre ici que l’on a : 

(66) |i m i nf ^> lnln " - = e -r 

n 

Une fonction arithmétique très étudiée, 
mais sur laquelle on sait encore peu de 
chose, est la différence p n + j — p„ entre 
deux nombres premiers consécutifs, On 
conjecture qu’il y a une infinité de valeurs 
de n pour lesquelles p n +\ — p n = 2 (nom- 
bres premiers ((jumeaux ») et que le nom- 
bre des p n ^ x ayant cette propriété est 
asymptotiquement égal à Cx/(ln A') 2 , avec : 

(produit étendu aux nombres premiers 
impairs) ; mais tout ce que l’on a pu 
prouver jusqu’ici, avec V. Brun, est que la 
série des inverses des nombres premiers 
jumeaux est convergente. Dans l’autre 


direction, on peut, par une étude poussée 
de la fonction Ç( L y), montrer que : 

Pu 1 — Pn = O 

si l’hypothèse de Riemann était vraie, elle 
entraînerait p n+] —p„ = 0(p„ ]/2 lll p„). 

Moyennes des fonctions arithmétiques 
On espère en général que, lorsqu’une 
fonction f définie pour les entiers > 0 a 
une allure irrégulière, la fonction 
F(m) =/(l) +/( 2) + +/(m), égale 
à m fois la « valeur moyenne » de f dans 
l’intervalle 1 ^ n ^ m, se comportera de 
façon plus satisfaisante ; c’est ce qui se 
passe pour la plupart des fonctions arith- 
métiques. Le théorème des nombres pre- 
miers en est un exemple : de façon géné- 
rale, si P est une partie de N et si l’on prend 
pour f’ia fonction caractéristique de P, la 
fonction correspondante m l—>> F (m)jm est 
ce qu’on appelle la densité de P dans 
l’intervalle [ 1, m] ; le théorème des nom- 
bres premiers dit que, pour l’ensemble P 
des nombres premiers, cette « densité » a 
une partie principale 1 /ln m. 

Pour certaines fonctions considérées 
supra (cf. Le point de vue formel ' in 
chap. 2), on peut effectivement obtenir des 
parties principales de leurs « moyennes » 
de façon élémentaire ; par exemple, on a : 

(67) ^ d(n) = xlnx + (2y — l)x + 0(Vx\ 

n £ x 

( 68 ) ai(«) = + 0(x înx), 

n ^ x 

(69) ^ <P(") = f 1 + 0(x lnx), 

n < x 

(70) 2>)| = J* + 0(VÔ, 

n < x 
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la dernière somme étant la « densité » dans 
l’intervalle [ 1, x] de l’ensemble des entiers 
sans facteur carré. 

À l’aide du théorème des nombres 
premiers, on établit : 

( 7 1) ^ p(n) = 0(x exp( — cvTnx)) = o(x), 

n ^ x 


(72) 


Z 


h(n) = 0(* exp( — cvTïïx)) = o(x), 


où C est une constante absolue et r un 
nombre vérifiant les relations r > 1, 
r > sup (l/|/"(w)|) et r > sup (l//'(w)) 3 . 
L’idée de la démonstration consiste à faire 
varier le domaine G en remplaçant la fonc- 
tion f(u) par f ( U ) + y, avec y^r~ l/3 ; 

soit G, cette région variable. Si l’on pose 
pour simplifier 0 = r -1/3 , (Ll = SUp f*(u ), 
on voit aussitôt que l’on a : 


A(G)- É>Jo K{Q * )dy ' 


^ ^ 1/3 m ; 


(73) z v(« ) = x In ln* + B* + o(x), 

n < x 


avec : 


on a d’autre part : 

1 ( 0 ) < 


»-»+Z(-HK) 

P 

(somme étendue aux nombres premiers). 

Le premier membre de (67) admet une 
interprétation géométrique intéressante : 
c’est le nombre des points (r, s) du réseau 
Z 2 dans le plan qui appartiennent à la 
région du plan formée des points (w, v) 
vérifiant u ^ 1/2, v ^ 1/2 et UV < X . 
Cette interprétation suggère aussitôt que 
la partie principale de ce nombre est l’aire 
de la région précédente et conduit à 
améliorer la majoration du terme complé- 
mentaire. D’une façon générale, considé- 
rons dans le plan la région G définie par 
S ^ U ^ n\ q ^ y ^ /(«), où .v — 1/2, 
W — 1/2 et q — 1/2 sont entiers ; f est 
supposée deux fois continûment différen- 
tiable, sa dérivée étant > 0 dans [s, vv], et 
sa dérivée seconde ne s’annulant pas dans 
cet intervalle. 

Soit I(G) le nombre de points du réseau 
Z 2 dans G et A(G) l’aire de G. On a alors 
l’inégalité suivante, établie par Yan der 
Corput : 

(74) A (G ) — I (G ) < Cr 2/3 sup/'(«), 


on majorera donc I(G) — A(G) si l’on sait 
majorer : 

| o e (I(G,)-A(G/))^. 

et on procédera de même pour A(G) — 
I(G) en donnant à y des valeurs négatives. 
Le point essentiel est que l’on peut écrire 
l’intégrale : 

O- 1 * 

sous forme d’une série double : 

(75) J* I(G ,) dy = ZI 8 P(y, m, n)dy , 

m, n 

où ; 

P (y,m,n) = JJ^ cos 2Tïmu cos liznv du dv, 

à l’aide du développement en série de Fou- 
rier de „Y — 1/2. Or on a 

P(j/, 0, 0) = A(G r ) ; tout revient à majorer 
au second membre de (75) la somme des 
termes autres que le terme principal corres- 
pondant à m = n = 0. On y parvient grâce 
aux hypothèses faites sur j et grâce à un 
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lemme de Van der Corput, d’après lequel, 
pour une fonction réelle F, on obtient : 

(76) ||' P e'W* < C/VÂ, 

où C est une constante absolue, si, dans 
l’intervalle [a, (3], on a F”(t) ^ X > 0. 
Appliquée convenablement à la fonction 
f(u) = x/u, l’inégalité (74) permet (théo- 
rème de Voronoï) de remplacer, dans (67), 
O(Vx) par 0(x 1/3 ln x). Si l’on prend pour 
G la région limitée par une ellipse 
au 2 + bv 2 = x, on obtient l’expression : 

(77) I(G) = A(G) + 0(x l / 3 ). 

En outre, Jarnik a pu montrer que, dans 
l’inégalité (74), il n’est pas possible de 
remplacer l’exposant 2/3 par un nombre 
plus petit, ce qui tend à conjecturer que, 
dans (77), l’exposant 1/3 est le meilleur 
possible. Mais on a particulièrement étudié 
le cas a = 6 = 1 ; si U(n) est le nombre de 
solutions de l’équation u 2 + v 2 = H (cf. 
Sommes de carrés, in chap. I), I(G) est, 
dans ce cas, la somme : 

^ U(n) = l(x) 

n ^ x 

et Van der Corput a pu prouver qu’il existe 
un a > 0 tel que : 

I(X) = roc + 0 (jc 1/3 -«) 

D’autre part, Hardy a démontré que, 
dans cette formule, on ne peut pas rempla- 
cer 1/3 a par 1/4 (on conjecture cepen- 
dant que n’importe quel exposant > 1/4 est 
possible). Ces deux résultats découlent 
d’une analyse extrêmement subtile, à partir 
de la remarquable identité de Hardy : 

(78) !(* +) + !(*— ) 

~ toc + Vx ^ j 1 (2 tt Vnx ), 

n — 1 


où J, désigne la fonction de Bessel 
d’indice 1. 

Interprétations probabilistes 
Étant donné une fonction réelle mesurable 
fdéfinie pour 0 ^ t < 1, pour tout nombre 
O) tel que oo Q) ^ -j- oo, on peut définir 
la « probabilité » pour que /(/ ) < 0) 
comme la mesure de l’ensemble des t véri- 
fiant cette condition : si on désigne ce 
nombre par a(o), la fonction Q est une 
fonction croissante et continue à gauche 
dans la droite réelle achevée R (cf. espaces 
MÉTRIQUES, chap. 1) telle que a(— oo) = 0 et 
(J ( + oo) = 1 et est dite « fonction de 
répartition » de f. La « moyenne » : 

]>)* 

de f est alors égale à : 

f + x d o(x ). 

J —00 

Les « lois limites » du calcul des pro- 
babilités affirment que, sous certaines 
conditions, pour une suite (f n ) de fonctions 
mesurables, les fonctions de répartition <J n 
correspondantes convergent vers une fonc- 
tion de répartition, dont la plus connue est 
la fonction de Gauss : 

Considérons maintenant une fonction 
réelle h définie dans l’ensemble N des 
entiers ^ 0. Pour tout entier N et tout 
G) G R, soit K n ( 0)) le nombre des entiers 
fl ^ N tels que h(n) < o ; la fonction : 

a N (w) = i K n (g>) 

est la fonction de répartition de la fonction 
f^(t ) définie, pour 0 ^ t < 1, par les 
conditions : 

/ n ( 0 = h(n\ 
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pour : 


n 

N 


< t < 


n+ 1 

N ’ 


0 < n < N— 1. 


Si ces fonctions a N tendent vers une 
limite a lorsque N tend vers + oo, cela 
signifie donc que, pour tout w, la suite des 
entiers n telle que h(n) < ü) a une densité 
ct((u) ; on dit alors que h a une « fonction 
de répartition » (j, 

On dit que h est additive si e h est 
multiplicative, soit h(mn) = h(m) h(n) 
si m et n sont premiers entre eux. Erdôs et 
Wintner ont montré que, pour de telles 
fonctions, on peut, en utilisant le théorème 
des nombres premiers, donner la condition 
nécessaire et suffisante suivante pour l’exis- 
tence d’une fonction de répartition. Les 
deux séries : 


(79) V ( A + W) 2 

P 

doivent être convergentes ; ici p parcourt 
l’ensemble des nombres premiers, avec 
h + (p) = h(p) si h(p) < I , et h^(p) — 1 
dans le cas contraire. En outre, d’après 
P. Lévy, la fonction de répartition (j est 
continue si et seulement si la somme des 
inverses \jp des nombres premiers pour 
lesquels /(/?)# 0 est infinie. 

Des exemples, où ces conditions sont 
vérifiées, sont donnés par les deux fonc- 
tions : 


Si la seconde des séries (79) converge, 
mais non la première, il y a encore une 
fonction de répartition pour la fonction : 

p K n 

Enfin, si les deux séries divergent, il faut 
considérer la fonction : 

g{n) = {h(n)-A{n))/B(n), 
où l’on pose : 



il y a alors toujours, d’après Erdos et Kac, 
une fonction de répartition pour g égale à 
la fonction de Gauss G(o). Par exemple, si 
l’on prend pour /z(n) la fonction v(n) et si 
K n (w) est l’ensemble des entiers n ^ N 
tels que : 

v(n) ^ ln ln n + co Vin ln n , 

alors K n (g))/N tend vers G((l>), et on peut 
même prouver la «loi du logarithme 
itéré » : 



JEAN DIEUDONNÉ 
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Voir la bibliographie à la fin de la partie C ci-après. 


1 Æ, i n ^; 

n n 

pour la première de ces deux fonctions, la 
fonction de répartition o(o) est en outre 
« singulière » au sens de Lebesgue (autre- 
ment dit, Erdos a montré qu’elle a une 
dérivée nulle presque partout, sans être 
constante). 


B. Nombres p-adiques 

On peut aborder l’étude d’un problème dio- 
phantien (cf. équations diophantiennes) 
en commençant par chercher les solutions 
modulo /?, un nombre premier quelconque : 
on est alors devant un problème plus facile, 
Car Z//?Z est lin corps (cf. DIVISIBILITE) . Cette 
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méthode ne donne qu’une information 
insuffisante pour le problème initial ; on la 
raffine en étudiant les équations modulop’” 
pour tous les entiers m ^ 1. L’anneau 
Zjf'Z n’est pas un corps, mais ses proprié- 
tés arithmétiques sont beaucoup plus sim- 
ples que celles de Z : c’est un anneau fini qui 
a un seul idéal premier (engendré par la 
classe dep) ; les autres idéaux sont les puis- 
sances de l’idéal premier. 

Supposons maintenant qu’on connaisse 
une solution x m £= Zjp m Z du problème 
modulo p m ; pour tout k ^ m 7 on en déduit 
une solution x k mod p k au moyen de 
l’application canonique évidente : 

y km .Z/p m Z^Z/p k Z, 

provenant de l’application identique de Z. 
Ces considérations nous conduisent 
à introduire les suites (x WJ ) telles que 
X m G Z/ P Z pour tout m et x k = (p km (x m ) 
pour k ^ m. L’ensemble Z p de ces suites 
est ainsi une partie du produit : 

n z/ p mz > 

m 

et c’est même un sous -anneau pour la 
structure d’anneau produit (car les (Ç km 
sont des homomorphismes d’anneaux) ; 
on dit que c’est la limite projective des 
anneaux Zjp m Z. L’anneau Z p ainsi défini 
s’appelle Vanneau des entiers p-adiques ; la 
méthode d’approche d’un problème dio- 
phantien envisagée plus haut consiste à 
étudier d’abord le problème dans Z p . Dans 
cet article, on donne les principales pro- 
priétés arithmétiques de cet anneau. 

1. Généralités 

Le noyau de l’ homomorphisme canonique 
Z — ► Z p est formé des entiers divisibles par 
toutes les puissances dep ; il est donc réduit 


à (O), et l’ homomorphisme considéré est 
injectif et permet d’identifier Z à un SOUS- 
anneau de Z„. La surjection canonique 
Z ZjfZ se décompose en l’injection de 
Z dans Z p suivie de la projection de Z p dans 
le facteur Zjp n Z ; on voit ainsi que cette 
dernière projection est surjective ; son 
noyau est l’ensemble des entiers p-adiques 
(jY /fJ ) tels que X n = 0, ce qui donne X m = 0 
pour m ^ n e t x m E p n Z/p m Z pour 
m > n ; autrement dit, ce noyau est 
l’ensemble des entiers p-adiques multiples 
de p n . On obtient ainsi l’isomorphisme : 

Z f /p*Z,= Z/p*Z 

pour tout entier n ^ 1. 

Pour n = 1 , cela montre que Z p j pZ p est 
un corps, donc que Fidéal pZ p engendré par 
p est maximal. Si un entier p-adique 
X = (x„) n’appartient pas à pZ p , chacune 
de ses composantes x m est inversible dans le 
facteur correspondant Z/p m Z et (x,“ l ) est 
inverse de X dans Z p ; ainsi l’idéal maximal 
P Z n est exactement l’ensemble des éléments 
non inversibles de Z p , et c’est donc le seul 
idéal maximal : l’anneau Z p est local (cf. 
ANNEAUX ET ALGÈBRES) etsoncorpsrésiduel 
est z P lpz p ~ F p , corps à p éléments. Les 
puissances successives de l’idéal maximal 
forment une suite décroissante (p m Z p ) 
d’idéaux dont l’intersection est visiblement 
{0) ; le plus grand de ces idéaux est 
p°Z p — Z p . La multiplication par p n est 
injective dans Z p ; il suffit de le vérifier pour 
n = 1, et px = 0 équivaut à px m = 0 dans 
Zjp m Z pour tout m, ce qui donne : 

d’où x m , = 0 . L’anneau Z p s’applique 
donc bijectivement sur l’idéal p n Z, {V et 
l’ensemble U = Z p — pZ p de ses éléments 
inversibles s’applique bijectivement sur : 

p n Z p — p n + 'Z p =p n \J ; 
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on voit ainsi que l’ensemble Z p { 0 } est 
réunion disjointe des //'U (n G N). Autre- 
ment dit, tout entier p-adique non nul x 
s’écrit d'une seule manière sous la forme 
p n u avec n G N et u G U entier p-adique 
inversible ; l’entier naturel n s’appelle la 
valuation p-adique de jç et se note U (je). Si 
x = p m u et y = p n \) sont des entiers 
p-adiques non nuis, avec u G U et u GU, 
on a ; 

xy — p m + n uv 0 , 

car UV est encore inversible, donc Z p est un 
anneau intègre ; on voit en même temps 
que : 

v p (xy) = v p (x) + v p [y), 

et on peut vérifier par ailleurs l’inégalité : 

v p (x + y) > inf(Vp(x), v p (y)) ; 

ces deux propriétés de la valuation 
p-adique restent vraies même si x ou y est 
nul lorsque l’on pose u (0) = + oc, élé- 
ment abstrait ajouté à N avec les proprié- 
tés habituelles : on a /? < + oo et 
n -j- (+ oo) = -(- oo pour tout fl G N. 

Considérons un idéal non nul a de Z p ; 
si n est la borne inférieure des valuations 
des éléments de a, on voit sans peine que 
a est l’idéal engendré par p ] \ Ainsi les seuls 
idéaux de Z p sont (0) et les p n Z p ; en 
particulier Z p est un anneau principal et il 
n’a qu’un seul idéal premier non nul pZ : 
un tel anneau s’appelle un anneau de 
valuation discrète (cf. anneaux commuta- 
tifs) . La décomposition en facteurs pre- 
miers d’un entierp-adique x est de la forme 
X = p n U avec n = V p (x) et u G U. 

Il y a une autre structure intéressante 
sur l’anneau Z p . On peut en effet considé- 
rer chaque Z/p m Z comme un anneau 
topologique discret et munir : 

Il z/ p mZ 


de la topologie produit ; on obtient ainsi un 
anneau topologique compact, comme pro- 
duit d’ensembles compacts (cf. théorème 
de Tychonoff, in topologie gÉnÉrale) . 
Comme les applications canoniques cp km 
sont continues, Z p est une partie fermée de 
cet anneau produit ; c’est donc encore un 
anneau topologique compact pour la topo- 
logie induite. Un système fondamental de 
voisinages de 0 pour la topologie produit 
est formé par les ensembles : 

V„ = {(*„) \x m = 0, m < n 1 ; 

la trace de V„ sur Z p n’est autre que l’idéal 
p n Z p qui est encore égal à l’ensemble des 
entiers p-adiques de valuation ^ n. Pour 
tout entier p-adique x, on pose : 

\ X \ p=p -v p (x) ; 

ce dernier nombre s’appelle valeur absolue 
p-adique de x, et l’on a : 

\xy\p = \x\p\y\p, \x +y\ p 6 sup(|*|,, \y\ p ), 

avec x \p = 0 si et seulement si x = 0. On 
voit alors que : 

(x,y)'-+d{x,y) = \y—x\ p 

est une distance (ultramétrique) sur Z p (cf. 
espaces MÉTRIQUES) ; les remarques précé- 
dentes montrent que cette distance définit 
la topologie de Z p . Notons maintenant que 
les isomorphismes : 

Z p /p n Z p - Z/p n Z 

montrent que Z est partout dense dans Z p . 
Comme Z p est complet (puisque compact), 
il est isomorphe au complété de Z pour la 
distance p-adique y — x 

Soit S un système de représentant ~ de F ; , 
dans Z p , c’est-à-dire un ensemble d’entiers 
padiques possédant exactement un élé- 
ment dans chaque classe mod pZ p . Par 
exemple, on peut prendre : 

s = {0, 1, . . »p — 1} ; 
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mais nous verrons plus loin un autre 
système de représentants plus intéres- 
sant. Pour tout entier p-adique x, il 
existe un élément s 0 de S et un seul congru 
à x mod P z p ; on a x — Sq = pX\ avec 
Xj G Z p . De même, il existe un couple 
unique d’éléments S\ G S et x 2 G Z p tels 
que X\ = S\ + px 2 , ce qui donne 
X = Sq -p pS\ + p 2 X 2 i en raisonnant par 
récurrence, on trouve pour tout n 
une manière unique d’écrire x sous la 
forme : 

x = s 0 -Mi/> + ... + s H p” +x n + x p 

avec s ; -G S et X n+I G Z p . Lorsque U tend 
vers l’infini, le reste x n _|_j/? n+I tend vers 0 
dans Z p ; on trouve donc un développe- 
ment en série infinie : 

x = jy. 

i 

avec des coefficients s t G S ; inversement, 
toute série de cette forme converge dans Z p 
et définit un entier p-adique, comme on le 
voit, en appliquant le critère de Cauchy ; 
notons d’ailleurs que, d’après l’inégalité 
ultramétrique : 

d(x,z) < sup (d(x t y) t d(y 9 z)) t 

une série converge dans Z p dès que son 
terme général tend vers 0. 

Au début du siècle, K. Hensel a intro- 
duit les nombres p-adiques en les définis- 
sant par des développements en série du 
type précédent. 

Le corps des fractions de Z p 
s’appelle le corps des nombres p-adiques ; il 
contient le corps Q des nombres rationnels 
comme sous-corps (autrement dit, c’est un 
corps de caractéristique 0). Chaque nom- 
bre p-adique peut s’écrire comme une 
fraction xjp n avec au numérateur un entier 
p-adique x et au dénominateur une puis- 


sance de p ; la valuation p-adique se 
prolonge à en posant : 

= i>(x)-(i€ZU{ + «). 

On a encore : 

v P {xy) = *>(*) + v P (y)> 

Vp(x +y)> inf(tfp(x), 

pour x, y G Q,. On fait de un corps 
topologique localement compact en le 
munissant de la topologie pour laquelle Z p 
est un sous-groupe additif ouvert (cf. 
algèbre topologique) ; cette topologie 
peut aussi être définie par la distance 
ultramétrique (x, y) *— ► d(x, y) = y x \ p 
correspondant à la valeur absolue 
x \ p = p~ v P {x \ Remarquons que Z p n’est 
autre que la boule unité : 

Z p = {*€Q,||*|, < 1} = {x\v p (x) > 0} ; 

de même, l’idéal maximal pZ p est défini par 
l’inégalité x \p < 1 ou aussi bien V /; (x) > 0. 
Le corps est complet, car il est locale- 
ment compact, et Q est un sous-corps 
partout dense ; donc Q p est isomorphe au 
complété de Q pour la distance p-adique. 

2. Équations p-adiques ; 
lemme de Hensel 

Revenons aux considérations du début et 
étudions un système d’équations : 

fa(x „X 2 *J=0, 

où a = 1, 2, ... . F et où les f a sont des 
polynômes à coefficients dans Z p ; on 
cherche les solutions (Xj, X 2 , .... X WI ) dans 
{Z p ) m . Par réduction modulo p n , on en 
déduit un système d’équations f att = 0 
dans Z/p n Z. Pour que le système étudié ait 
une solution dans (Z p ) n \ il faut et il suffit 
que pour tout n le système réduit mod p n 
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ait une solution dans {Z/p n Z) m . En effet, 
une solution dans (Z p ) m n’est autre qu’une 
suite de solutions mod p n pour tous les n , 
qui se correspondent par les applications 
canoniques (p^ ; si X„ C (Zjp n Z) m désigne 
l’ensemble des solutions mod p n , on voit 
que l’image dans X„ de l’image X des 
solutions dans {Z p ) m est : 

y„ = p| <p„,(x,), 

g > « 

qui est non vide si chaque X, est non vide 
(intersection décroissante d’ensembles 
finis non vides ; en termes plus savants, on 
observe que X est limite projective des X n 
et que la limite projective d’une suite 
d’ensembles finis non vides est non vide). 

De la même manière, on prouve que 
l’existence d’une solution primitive dans 
[Z p ) m équivaut à l’existence d’une solution 
primitive mod p n pour tout n ; un élément 
primitif de (Z p ) n \ ou de (Z/p n Z) m , est, par 
définition, un élément dont l’une des m 
coordonnées est inversible. Remarquons 
que l’existence d’une solution primitive 
dans (Z/' équivaut encore à l’existence 
d’une solution différente de 0 dans (Q ,r ; 
on le voit en réduisant au même dénomi- 
nateur. 

Le résultat suivant donne une condition 
suffisante pour qu’un zéro mod p n d’un 
polynôme /E Z p [X^ X 2 , . . . . X,„] se relève 
en un zéro dans Z p . Soit x E ( Z p ) m tel que 
f(x) = 0 (mod p n ) ; s’il existe un indice j 
tel que : 

> n— n/2 

exr ’ p p ’ 

il existe un élément y E (Z p ) m tel que 
f{}') = 0 et y = x (mod p n ~ k \ où : 



On construit y comme limite d’une suite 
(x,) d’éléments de ( Z p ) m vérifiant : 

(*,) = 0(mod p" + i), ^(^(*«)) = k > 

x 0 =x, x, + 1 =x } (mod />"+*-*); 

l’existence d’une telle suite résulte du 
lemme suivant. 

Lemme. Soit /E Z /; [X] et x E Z^ tels que 
f(x) = 0 (mod p n ). Si : 

\f\x)\ P >P~ n/ \ 

il existe X E Z,, tel que : 

f(x') =0 (mod p n + l ) f 
\f\x')\ P = \f\x)\ p , x'=x(mod p»~ k ), 

où k = v p (f’(xj). 

Pour démontrer ce lemme, on cherche 
x’ sous la forme x' = x + p n ~ k z et on 
utilise la formule de Taylor : 

f(x 4 -p n ~ k z) =/(*) + p n ~ k zf\x ) + p ln ~ lk t y 

où test un entierp-adique ; disons que f (x) 
est multiple de p n et que la valuation de 
f’(x) est k , soit f’(x) = p n y et f ‘(x) = p k u 
avec j E Z p et u E U, donc : 

f{x +p n ~ k z ) —p n {y -)- zu + p n ~ 2k t). 

Comme par hypothèse n — 2k ^ 1, il 
suffit de choisir z tel que y -f - ZU soit 
multiple de p , c’est-à-dire z = — VU 1 
(modp) ; alors f (.x ~|- p n ~ k z) est divisible 
par et : 

\x + p n k z ) =f'(x) + p n ~ k zt ' 

-p k (u + p n ~ lk zt ') 

a pour valuation h. 

Appliquons ce résultat dans le cas où 
n = 1 ; on a alors nécessairement k = 0 et 
on voit que, si £ E (F / ,) m est un zéro du 
polynôme : 

fe f,[x 1 ,x 2 ,...>x m ], 
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déduit defpar réduction modulo p, et si 
une au moins des dérivées partielles pre- 
mières de / ne s’annule pas en £ (zéro 
« simple »), alors il existe un zéro defdans 
(Z p ) m qui relève Par exemple, si f est 
homogène de degré 2 (forme quadratique) 
et si son discriminant est inversible dans 
Z p , f est une forme quadratique non 
dégénérée à coefficients dans F„ ; lorsque 
tout £ G (¥ p ) m — { 0) t e 1 que 
f (£) = â est une racine simple et se relève 
donc en un x G (Z p ) m tel que / (.y) = a. 
Lorsque p = 2, on montre de même que, 
si x est un élément primitif de (Z 2 ) m tel que 
f(x) = a (mod 8), il existe y G (Z 2 ) m tel 
que f (y) = a et y = X (mod 4). Pour 
ïïl = 1, ces résultats permettent de déter- 
miner les éléments inversibles de Z p qui 
sont les carrés ; lorsque p ^ 2, ce sont les 
éléments de U dont la classe modp est un 
carré dans F,, ; nous étudierons plus loin 
les carrés de Z p par une autre méthode. 

Le lemme de Hensel est un résultat 
voisin du précédent et s’énonce ainsi : soit 
/ G Z^[X] un polynôme à une indéterminée 
à coefficients entiersp-adiques ; supposons 
donnée un décomposition / = cpip de la 
réduction de / modulo p en produit d’un 
polynôme unitaire cp de degré d et d’un 
polynôme ip étranger à (p ; il existe un 
couple unique (g, h) de polynômes g, h 
appartenant à Z /? [X] tels que f — gh, 
g = fa = ^ et que g soit unitaire de 
degré d. 

3. Structure 

du groupe multiplicatif Q * 

On sait que tout élément non nul de Q p 
s’écrit d’une seule manière sous la forme p n u 
avec n G Z et u G U, groupe des éléments 
inversibles de Z p ; cela donne immédiate- 
ment un isomorphisme ~ Z X U. Il 


reste à étudier la structure du groupe U ; on 
définit une filtration décroissante (U,) de U 
en posant pour tout n > 0 : 

U„ - {x€Z p \x = 1 (mod /?")}, U 0 = ü; 

ainsi U„ est le noyau de F homomorphisme 
canonique de U dans le groupe des élé- 
ments inversibles de Zjp n Z. Il est clair que 
U/Uj^nF/,, groupe cyclique d’ordre 
p — 1 ; pour n ^ 1, une bijection 
x ' * 1 + p n X de Z p sur U„ applique pZ p 
sur U„_|_i et définit un isomorphisme de 
groupes : 

Z/p Z ~ Z p /pZ p =+ V n /U n + j , 

en vertu de l’identité : 

(1 +p n x){ 1 +p n y) = 1 +p n {x +.y) +p 2n xy 
= 1 +p n (x +yXmodp" + 1 ) ; 

ainsi U n /U n _|_j est cyclique d’ordre p pour 
tl ^ L 

De ces considérations on peut déduire 
qu’il existe un sous-groupe unique V de U 
isomorphe à F^* et que U est isomorphe au 
produit V X U, ; le sous-groupe V est 
l’ensemble des entiers padiques x tels que 
X p ~ l = 1, et V U {0} est un système de 
représentants de F^ dans Z p qui est stable 
par multiplication, c’est un système de 
représentants multiplicatifs (cf. chap. 1). 
Pour obtenir ces résultats, on considère U 
et Uj comme limites projectives des suites 
de groupes (U/U„) et (Uj/UJ respective- 
ment, et on est ramené à prouver l’exis- 
tence d’un unique sous-groupe V„ de U/U„ 
isomorphe à F p et tel que : 

U/U^V, XU|/U B ; 

comme u,/u„ est d’ordre p n 1 et que : 

(uajj/cu./uj^f; 

est d’ordre p — 1 premier à p n ~\ on 
peut démontrer que U/U„ est produit de 
U,/U„ par le sous-groupe des racines 
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( p — I)-ièmes de 1 en utilisant l’identité de 
Bezout (cf. anneaux commutatifs). Che- 
min faisant, nous avons démontré que le 
corps des nombres p-adiques Q p contient 
les racines (p — l)-ièmes de 1, 

Il faut enfin élucider la structure du 

groupe U,. Nous allons voir que U, est 
isomorphe au groupe additif Z p si p est 
différent de 2, et à { ± 1 } X Z 2 si p = 2. 
Pour p ^ 2, on choisit un élément a de U, 
qui n’appartient pas à U 2 et on considère 
l’ homomorphisme x a” de Z dans Uj ; 
on a a — 1 + avec «6U, donc 
a’ = 1 + xpu + p 2 t (t entier />adique) 
par le développement du binôme, et, pour 
x premier à p , cela montre que a x est 

encore un élément de Uj qui n’est pas dans 
U 2 i au contraire, pour x = p ] \ on trouve 
que a” est un élément de U/,+ ] qui n’est pas 
dans U/,+ 2 , en remarquant que pour tout 
n la puissance p-ième d’un élément de 

U„ U„ + , appartient à U w+] — U„ +2 . Ces 

résultats permettent de voir que l’image 
réciproque de U„ +1 dans Z est exactement 
p n Z ; par conséquent, x i— ► q x définit un 
homomorphisme injectif de Zjp n Z dans 
u,/u„ +l , et cet homomorphisme est même 
un isomorphisme, car les deux groupes ont 
le même nombre d’éléments. En passant à 
la limite projective pour n oc, on obtient 
l’isomorphisme cherché Z /; ^+ U, ; on 
notera encore a x l’image d’un entier p- adi- 
que X par cet isomorphisme. Dans le cas où 
p = 2, on observe d’abord que : 

U = U 1 ^{± 1} x u , 

et on définit un isomorphisme de Z 2 sur U 2 
à partir de l’ homomorphisme x i— ► a x de Z 
dans U 2 construit à l’aide d’un élément a 
de U 2 qui n’appartient pas à U 3 (ainsi a est 
congru à 5 mod 8). En résumé, on a trouvé 
que le groupe multiplicatif Q * est isomor- 
phe à : 

Z x (Z /{p - 1)Z) X L r 


si p ^ 2 et à : 

z x (Z/2 Z) x z,, 

sip = 2. 

Nous sommes maintenant en mesure de 
déterminer quels sont les carrés dans Q„. 
Pour p ^ 2, on a : 

Q^ 2 ^ 2 Z X F* 2 X Z p , 

car, 2 étant inversible dans Z p , on a 
2Z p = Z p ; on retrouve le fait qu’un élé- 
ment inversible de Z p est un carré si et 
seulement si son image dans F /; est un 
carré. Le groupe quotient QpIQp* 2 est 
isomorphe à : 

(Z/2 Z) X (JF P /F* 2 ) ~ (Z/2 Z) x (Z/2 Z) ; 

c’est un groupe à 4 éléments qui admet 
pour système de représentants dans Q y) * 
l’ensemble ( 1, /?, «, up] où u est un entier 
qui n’est pas résidu quadratique modp. 

Lorsque p = 2, on a : 

Qj 2 — 2Z X 0 X 2Z 2 = 2ZX U 3 , 
et alors : 

U 3 = [u E Z 2 u = 1 (mod 8)} 
est l’ensemble des carrés inversibles de Z 7 ; 

Q 2 /Q* 2 — Z/2 Z — * Z/2 Z X Z/2 Z 

est un groupe d’ordre 8 qui admet pour 
système de représentants { 1, 2, 3, 5, 6, 7, 
10, 14} dans Q 2 . Notons que Q^* 2 contient 
Uj sip ^ 2 et U 3 sip = 2 ; donc, c’est un 
sous-groupe ouvert de Q^* ; le groupe 
quotient Q//Q / 2 peut être considéré 
comme un espace vectoriel sur le corps à 
2 éléments F 2 , de dimension 2 ou 3 suivant 
que p 7 ^ 2 ou p = 2. Sur cet espace 
vectoriel, il y a une forme bilinéaire cano- 
nique, qui est symétrique et non dégéné- 
rée ; elle est définie par le symbole de 
Hilbert (a, b ), a, b (z Q p \ qui vaut 1 ou — 1 
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suivant qu’il existe ou non un élément non 
nul de (Q,) 3 qui annule la forme quadra- 
tique Z 2 aX 2 bY 2 (cf. divisibilité ; la 
partie C ci-après -Nombres algébriques ; 
formes QUADRATIQUES). À l’aide du sym- 
bole de Hilbert, on définit un invariant E(f) 
associé à toute forme quadratique j à 
coefficients dans Q /? ; si : 

/(* i.*2 *„)=«,*? + “ 2 x 2 2 + + a m x 2 m , 

dans une base orthogonale, on a : 

< <j 

et on peut montrer que e(J ) ne dépend pas 
de la base orthogonale choisie. Pour que 
deux formes quadratiques à coefficients 
dans Q /? soient isomorphes, il faut et il 
suffit qu’elles aient même rang, même 
invariant 6 et que leurs discriminants aient 
la même classe dans Q//Q/;* 2 ï on trouve 
ainsi 4 (resp. 8) classes de formes de rang 1 
et 7 (resp. 15) classes de formes de rang 2 
et enfin 8 (resp. 16) classes de formes de 
rang n ^ 3 si p ^ 2 (resp. p = 2). 

4. Analyse p-adique 

On peut développer une théorie des fonc- 
tions analytiques de variables p-adiques en 
définissant de telles fonctions par des déve- 
loppements en séries entières convergentes 

(Cf. FONCTIONS ANALYTIQUES ■ Fonctions 

analytiques d’une variable complexe). 

Par exemple, la série exponentielle : 

exp X = l + x + + — + 
n ! 

converge dans le « disque ouvert » de 
défini par l’inégalité : 



en effet : 

v P ( n !) = V P W + V P ( 2 ) + + v p (n\ 


et le nombre d’entiers k ^ n tels que 
V p (k) ^ r est égal à la partie entière [/?///] 
du nombre rationnel n/p\ ce qui donne : 


en désignant par s n la somme des coeffi- 
cients du développement p-adique de n (si 
n — Xcijp 1 avec 0 ^ p — 1 , on a 
S n = Xüj) ; on en déduit facilement que 
\) p ( \jn\)jn converge vers 1 /(p 1) pour 

n infini, c’est-à-dire que \jn ! | l//7 converge 
vers p 1/(/J 7 On peut donc définir une 
fonction exponentielle X exp x pour 
\x\< p~ ]!{p ~ X) ; il est clair que l’on a : 

exp(x: + y) = expx . exp y 

et que la fonction exponentielle ne s’annule 
pas dans son disque de convergence : elle 
définit un homomorphisme de ce disque, 
qui est un sous-groupe du groupe additif de 
(à savoir pz p si p ^ 2 et 4Z 2 si P = 2), 
dans le groupe multiplicatif de Q /; *. C’est 
en fait un isomorphisme sur un SOUS- 
groupe de Q /? \ comme on peut le montrer 
à l’aide de la fonction logarithme définie 
par la série : 

log(t + Y) = Y -V + 

Y" 

+ ( - 1 )— » — + 
n 

qui converge pour V p {}-) > 0 et définit 
donc un logarithme dans U, ; on peut 
vérifier que : 

log (exp x ) = x, exp (log (1 + x)) = 1 + x 

pour v p (x) > l /{p— 1) et, par suite, exp 
définit un isomorphisme de pZ. p sur U, si 
p 2 et de 4 Z 2 sur Ut si p = 2 ; on 
retrouve les isomorphismes du chapitre 3. 

Comme le corps est totalement 
discontinu, on ne peut espérer une théorie 
globale raisonnable pour les fonctions 
analytiques au sens habituel, c’est-à-dire 
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définies localement par des développe- 
ments en série. Il y a cependant une théorie 
globale pour les fonctions « strictement 
holomorphes » ; donnons, par exemple, la 
définition des fonctions strictement holo- 
morphes dans la « couronne » : 

[xEQ p | r < |*| < R I- 

Ce sont les fonctions définies par des 
développements de Laurent : 

/(*>= y a ’ x "’ 

nez 

qui vérifient la condition de convergence 
suivante : pour tout p E [r, R], a n p" tend 
vers 0 lorsque n tend vers ± oo ; l’espace 
L(r, R) de ces développements de Laurent 
est un espace de Banach sur le corps Q p 
pour la norme (ultramétrique) : 

ll/ll = sup (sup I a „ I r ", sup | a „\ R" ), 
n n 

et on peut y définir une multiplication qui 
en fait une algèbre de Banach. On démon- 
tre que L (r, R) est un anneau principal et 
que ses éléments irréductibles sont les poly- 
nômes unitaires irréductibles dont les raci- 
nes (dans une clôture algébrique de Q /; ) ont 
des valeurs absolues dans l’intervalle [Y, R], 
ainsi que les produits de ces polynômes par 
des éléments inversibles ; ces derniers sont 
les développements de la forme : 

ccN ( 1 + ]jr fl «•*’)■ 

n > 1 

avec a,, f 1 < 1 et a n R" < 1 pour tout n. 
M. Lazard a généralisé ces résultats au cas 
d’une couronne « ouverte » (définie par 
des inégalités strictes) et a obtenu des 
théorèmes analogues à ceux de Weierstrass 
(développement en produit infini d’une 
fonction strictement méromorphe) et de 
Mittag-Leffler. 


En s’inspirant de la théorie de Jacobi, 
J. Tate a élaboré une théorie analytique des 
fonctions elliptiques sur un corpsp-adique. 
Soit q E tel que 0 < \q \ < 1 , on consi- 
dère le corps des fonctions strictement 
méromorphes dans — {0} (couronne de 
rayons 0 et oo) qui sont invariantes par la 
multiplication par q , c’est-à-dire f (qx) 
= f(x) ; on peut montrer que c’est un corps 
de fonctions algébriques d’une variable et 
que son genre est 1, c’est-à-dire qu’il s’iden- 
tifie au corps des fonctions rationnelles sur 
une courbe elliptique. Cette théorie donne 
l’uniformisation de certaines courbes ellip- 
tiques sur ; plus récemment, M. Ray- 
naud et D. Mumford ont étudié d’une 
manière analogue les variétés abéliennes et 
les courbes algébriques de genre ^ 2. 

J. Tate a également donné une défini- 
tion des espaces analytiques p-adiques qui 
permet d’étudier les fonctions analytiques 
de plusieurs variables. Les principaux théo- 
rèmes de la théorie des faisceaux cohérents 
ont été établis pour ces espaces (J. Tate et 
R. Kiehl). Le renouveau d’intérêt pour 
l’analyse p-adique vient surtout de la 
démonstration par Dwork de la rationalité 
de la fonction zêta d’une variété algébrique 
sur un corps fini (cf. fonction ZÊTA) ; la 
méthode utilisée consiste à démontrer la 
rationalité d’une série formelle à coeffi- 
cients entiers en étudiant ses propriétés 
comme fonction analytique p-adique (pour 
différents nombres premiers p) ; les pro- 
priétés en question s’obtiennent, dans le 
cas de la fonction zêta, en appliquant la 
théorie de Fredholm p-adique (J.-P. Serre ; 
Cf. théorie SPECTRALE) . 

II existe aussi une théorie des groupes 
de Liep-adiques tout à fait analogue à celle 
des groupes de Lie réels ou complexes (cf. 
groupes - Groupes de Lie). Le résultat du 
chapitre 3 sur la structure de Q p * se 
généralise ainsi : tout groupe de Lie 
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commutatif de dimension n sur 
contient un sous-groupe ouvert isomorphe 
à (Z p ) n ; si le groupe considéré est compact, 
c’est une extension d’un groupe fini par 
(Z p ) n . La théorie des représentations linéai- 
res pour les groupes de Lie p-adiques a été 
développée par F. Bruhat ; dans le cas 
commutatif, on dispose de la transforma- 
tion de Fourier comme dans le cas classi- 
que et le groupe dual du groupe additif Q /; 
est isomorphe à Q^. Signalons enfin l’exis- 
tence d’une théorie des fonctions sphéri- 
ques p-adiques et les travaux de F. Bruhat 
et J. Tits sur la structure des groupes 
algébriques p-adiques. 

5. Extensions 

On connaît beaucoup d’autres anneaux de 
valuation discrète que les anneaux Z p ; 
nous pouvons citer l’anneau m des 
séries formelles à une indéterminée à 
coefficients dans un corps k, ou l’anneau 
local d’un point régulier sur une courbe 
algébrique (ou sur une courbe analytique 
complexe ; cf . géométrie algébrique). Si 
A est un anneau de valuation discrète de 
corps des fractions K et si TrA est l’unique 
idéal premier non nul de A, les idéaux de 
A sont 0 et les 7T /? A (« E N) ; tout élément 
X ^ 0 de K s’écrit d’une seule manière 
sous la forme x = 7 T n U où n E Z et où u est 
un élément inversible de A ; la valuation de 
X est l’entier u(à') = n et l’application 
v :K* — ► Z est un homomorphisme sur- 
jectif de groupes vérifiant l’inégalité 
\)(x -f- v) > inf (u(.Y), u(v))« Inversement, 
la donnée d’une valuation discrète 
u : K* — ► Z détermine un sous-anneau : 

A = {* 6 K 1 1> (x ) ^0}, 

où l’on a posé u(0) = + oo, qui est un 
anneau de valuation discrète et dont l’idéal 


maximal est l’ensemble des éléments de 
valuation > 0. La valuation définit une 
valeur absolue ultramétrique : 

x^\x\ =«*), 

où a est un nombre réel fixé appartenant 
à l’intervalle ]0, 1] ; on a : 

•v 1 = 1*1 •LH. |*+H^s»p(l*l.bl). 

et x ne s’annule que pour x = 0. Dans le 
cas où K est complet pour la topologie 
définie par cette valeur absolue, il possède 
des propriétés très semblables à celles de 
Q ; pour qu’il soit localement compact, il 
faut et il suffit qu’il soit complet et que le 
corps résiduel k = A/îtA soit fini (cf. la 
partie C ci-après - Nombres algébriques). 
Si A est un anneau de valuation discrète 
complet et si L est une extension finie de 
son corps des fractions K, on démontre 
que la fermeture intégrale B de A dans L 
est encore un anneau de valuation discrète 
complet et que c’est un A-module libre de 
rang [L :K] ; désignons par tt un généra- 
teur de l’idéal maximal de A (une «uni- 
formisante ») et par w la valuation définie 
par B ; l’entier e = H’(tt) s’appelle l’indice 
de ramification de L sur K. La valeur 
absolue de K se prolonge d’une manière 
unique à L. Considérons un anneau de 
valuation discrète complet A ; supposons 
que son corps des fractions K soit de 
caractéristique 0 et son corps résiduel k de 
caractéristique p > 0. Alors, l’injection 
canonique de Z dans A (resp. de Q dans 
K) se prolonge par continuité en : 

Z, -* A (resp. — K) ; 

l’entier e — v(p), où p est la valuation 
définie par A, s’appelle l’indice de ramifi- 
cation absolue de A. On démontre 
(I. S. Cohen) que, pour tout corps parfait k 
de caractéristique /?, il existe un anneau de 
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valuation discrète complet A absolument 
non ramifié (c’est-a-dire d’indice de rami- 
fication absolue égal à 1, ce qui signifie que 
l’idéal maximal de A est p A) dont le corps 
résiduel est k; cet anneau est unique à 
isomorphisme (unique) près, et sa cons- 
truction se fait au moyen des vecteurs de 
Witt ; ainsi Z p est l’anneau de valuation 
discrète complet absolument non ramifié 
de corps résiduel F /r 

Si A est un anneau de valuation discrète 
complet de caractéristique un nombre 
premier p , alors son corps résiduel k est 
aussi de caractéristique /?, et on démontre 
qu’il admet dans A un système de repré- 
sentants qui est un sous-corps (les repré- 
sentants multiplicatifs sont également 
additifs ; cf. chap. 3) ; on en déduit, en 
utilisant des développements de type hen- 
sélien par rapport aux puissances d’une 
uniformisante, que A est isomorphe à 
l’anneau des séries formelles k[[T]]. Il en 
est de même si k est de caractéristique 0. 

L’analyse p-adique se généralise en 
remplaçant Q /? par un corps valué complet 
ultramétrique quelconque. Les résultats et 
les méthodes sont les mêmes (sauf ceux qui 
font intervenir les propriétés arithmétiques 
particulières à Q^,). 

CHRISTIAN HOUZEL 

Bibliographie 

Voir la bibliographie à la fin de la partie C ci-après. 

C. Nombres algébriques 

Les mathématiciens grecs avaient décou- 
vert que certains rapports de grandeurs ne 
sont pas rationnels, c’est-à-dire qu’ils ne 
sont pas égaux au rapport de deux entiers : 
il en est ainsi du rapport de la diagonale 
d’un carré à son côté, puisque aucun 
nombre rationnel n’a un carré égal à 2. 


Plus généralement, Théétète (V e S. avant 
J.-C.) a établi qu’un entier qui n’est pas le 
carré d’un entier n’est pas non plus le carré 
d’un nombre rationnel. Le dixième livre 
des Éléments d’Euclide est consacré à 
l’étude et à la classification des grandeurs 
irrationnelles rencontrées dans les cons- 
tructions géométriques. 

Les recherches sur les équations algé- 
briques ont toujours été inséparables de 
problèmes touchant la nature des solutions 
de ces équations. Durant le XVIII e siècle, il 
fut établi que les n racines d’une équation 
algébrique de degré n à coefficients réels 
étaient des nombres complexes (cf. nom- 
bres complexes) . On appelle maintenant 
nombre algébrique tout nombre complexe 
qui est racine d’une équation algébrique à 
coefficients rationnels : ainsi VT, racine de 
l’équation x 2 — 2 = 0, ou bien i, racine de 
l’équation x 2 -f- 1 = 0, ou encore e 2,Tr / rt , 
racine de xf 1 ™ 1 = 0, sont des nombres 
algébriques ; au contraire e, tt, log 2 ou i l 
ne sont pas des nombres algébriques (cf. 
nombres transcendants) . 

1 . Équations diophantiennes 

Les problèmes de théorie des nombres 
conduisant à résoudre des équations de 
degré > 2 ont progressivement montré la 
nécessité d’étudier les propriétés arithmé- 
tiques des nombres algébriques et de bâtir 
ainsi une extension de l’arithmétique élé- 
mentaire. Le premier de ces problèmes est 
probablement celui qu’ Euler a impropre- 
ment attribué à Pell : il s’agit de résoudre 
en nombre entiers x et y l’équation 
X 2 — Dy 2 = ± 1, où D est un entier positif 
donné, sans facteur carré. Euler remarqua 
très tôt que cette équation peut encore 
s’écrire : 

(x + y VD)(* — y VD) = ± 1 
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et que, par suite, si (x, y) en est une solu- 
tion, on en tire une infinité d’autres (w, v) 
en calculant (x -j- y\/ D)" = u + t’VT) 
pour tout n E N. L’équation x 3 + j/ 3 = j 3 
a fourni à Euler une autre occasion 
d’exploitation arithmétique de nombres 
irrationnels (imaginaires cette fois) ; pour 
établir que cette équation n’a pas de 
solution non triviale en nombres entiers 
(c’est un cas particulier du « dernier théo- 
rème de Fermât »), Euler (1770) se fonde 
sur le fait, admis sans démonstration, que, 
si p et q sont des entiers premiers entre eux 
tels que (p + qV^~J)(p — qV^J) 
= p 1 3q 2 soit un cube, alors chacun des 
deux facteurs imaginairesp ± 3 est le 

cube d’un nombre complexe de la même 
forme. 

Périodes 

Un autre type de nombres algébriques 
apparaît dans la dernière section des Dis- 
quisitiones arithmeticae de Gauss (180 1), 
OÙ se trouve élaborée la théorie de l’équa- 
tion de la division du cercle en n parties 
égales, avec n premier impair. Si r est l’une 
des racines imaginaires de cette équation, 
les autres sont r 2 , r 3 , .... r" -1 , et Gauss 
introduit certaines sommes partielles de 
ces racines, qu’il appelle périodes, et qui 
sont solutions d’équations de degrés infé- 
rieurs : si j est un facteur de fl 1 et si A 
est un entier quelconque, la période A) 
de longueurfest, par définition, la somme : 

(/, A) = H- + r ^ 

où h est un entier premier à U tel que //= 1 
(mod n) mais que h° ^1 (mod n) si 
1 ^ (1 ^ f— 1 ; la période ne dépend pas 
du choix de h vérifiant ces propriétés, et on 
obtient un tel h en posant h = où g est 
une racine primitive modulo n (cf. divisi- 
bilité) et e = (n ™ 1 )// Il y a e périodes 
distinctes de longueur /, correspondant à 


A = 1, g, g 2 , . . . . g°~ l (sans compter 
( / , 0) =/), qui sont les racines d’une 
équation de degré e à coefficients entiers ; 
ensuite, lesfracines t Àh< ‘ qui constituent la 
période (f , j A) sont les racines d’une équa- 
tion de degréfdont les coefficients sont des 
combinaisons linéaires à coefficients 
entiers de 1 et des e périodes de longueur 
f. Gauss établit que le produit de deux 
périodes de longueur f est une combinai- 
son linéaire du type précédent : ces com- 
binaisons forment donc un sous-anneau du 
corps C des nombres complexes (cf. 
anneaux et algÈbres) ; de plus, si p est 
une période de longueur /, les autres 
s’expriment par des polynômes en p (de 
degré au plus e 1) à coefficients ration- 
nels. Lorsque e = 2, les deux périodes de 
longueur m = (n — l)/2 sont ( m , 1) et (m, 
g), et elles sont construites avec h = g 2 ; la 
première est la somme des r u avec a résidu 
quadratique modulo n et la seconde la 
somme des r h avec b non résidu (cf. 
divisibilité) . Gauss montre que l’équation 
dont les racines sont ces deux périodes est 
x 2 -|-x±v = 0si n = 4 v ±1 ;le discri- 
minant de cette équation est ± n , dont la 
racine carrée est donc la valeur de la 
différence des deux périodes : 


(m, I ) — (m, g ) = 


-V\ 

n ) 


OÙ /M est le symbole de Le Gendre. Les 

\n) 

expressions du type : 


!(£>*- Z" 

À mod n k mod n 

(puisque ^ r* = 0) et leurs généralisa- 

hmod n 

dons hmod n sont appelées sommes de 
Gauss ; elles jouent un grand rôle en 
théorie des nombres, et Gauss lui-même en 
tira deux démonstrations de la loi de 
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réciprocité quadratique (la quatrième, 
1808, et la sixième, 1818). Si l’on précise 
la racine r choisie, par exemple r = e 2m ^ n , 
il convient de préciser aussi celle des deux 
racines carrées de ± n qui donne la valeur 
de la somme de Gauss, et ce problème 
arrêta Gauss pendant longtemps. En 
notant z - 0 et z = 0 les deux équations 
de degré m dont les racines sont respecti- 
vement les r“ (a résidu quadratique modulo 
n) et les r* 7 ( b non résidu), on a : 


et Gauss en déduit que : 

x n 1 

4 ^- r = Y2 ±« z2 , 

où Y = 2 x?' + x m_1 -h ... et Z — x" î_1 
+ . sont des polynômes en x à coeffi- 
cients entiers ; si p est un nombre premier 
^1 (mod n ), et si xf 1 = 1 (modp) (mais 
X* ^1 (modp) si 1 ^ s ^ n 1), on a 
donc Y 2 = ± nZ 2 (modp) et (±n/p) — 1, 
ce qui donne un cas particulier de la loi de 
réciprocité (cf. DIVISIBILITÉ). 

Lorsque e = 3, les périodes p, p' et p” 
de longueur m — (n ™ |)/3 sont (m, 1), (m, 
g) et (m, g 2 ), et ce sont les racines d’une 
équation du troisième degré x 3 + x 2 MX 
— ( a 2 — bc) = 0, où a, b et c sont des 
entiers tels que pp’ = bp + cp r H- ap" ; 
ces entiers a, b, c sont aussi les nombres de 
solutions (x, y) modulo n pour les 
congruences x 3 + 1 = Xp 3 (mod n ), avec 
A = 1, g ou g 2 , et Gauss montre que 
4n = (6a 3 b - 3 c - 2) 2 + 27 (b ~ c) 2 . 
Ainsi, le quadruple d’un nombre premier 
n de la forme 3 m + 1 est représenté par 
la forme quadratique x 2 27 v 2 (cf. for- 
mes QUADRATIQUES) ; comme il est facile de 
voir qu’une telle représentation est unique, 
elle donne, inversement, un moyen de 
déterminer les entiers a, b et c. 


Lien avec les fonctions elliptiques 


La théorie des fonctions elliptiques 
(cf. fonctions analytiques - Lonctions 
elliptiques et modulaire) est une autre 
voie par laquelle les nombres algébriques 
sont intervenus en mathématiques : si p est 
une fonction elliptique de Weierstrass, on 
sait en général exprimer p (nu) par une 
fonction rationnelle de p(u) et de p'(i/) 
lorsque n est entier ; mais, pour certains 
modules, dits « singuliers », on a encore 
une telle expression pour ft = ü ± iVT), 
avec a et b entiers convenables (b ^ 0). 
Lorsque cela se produit, on dit que la 
fonction elliptique admet de la multi- 
plication complexe ; Gauss a rencontré 
cette situation dès la fin du XVIII e siècle, à 
propos de la fonction elliptique x = si u 
(« sinus lemniscatique ») qui inverse l’inté- 
grale : 



dt 

VI—/ 4 


(son module J vaut 1) ; comme si (iu) est 
égal à i si w, la fonction si admet de la 
multiplication complexe par tous les 
entiers de Guuss m + ni, où m, n G Z. 
Abel (1828) a utilisé cette multiplication 
complexe pour établir que l’équation algé- 
brique dont les racines sont les nombres 
s1((jl )//?), où p est un nombre premier de la 
forme 4 k + 1 et 0} est l’une quelconque 
des périodes de la fonction si, est résoluble 
par radicaux ; dans ce cas, p = m 2 + n 2 
est le produit de deux entiers de Gauss 
m ± in (cf. la partie A ci-dessus ■ Théorie 
analytique des nombres), et Abel montre 
que la méthode de Gauss pour la division 
du cercle s’applique à l’équation dont les 
racines sont : 


si 


( 


Ci) 

m -f in 


)• 
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Réciprocité biquadratique 

Les mêmes entiers de Gauss donnent le 
cadre où Ton peut étudier la loi de 
réciprocité biquadratique , qui relie la réso- 
lubilité des deux congruences x 4 = p 
(mod q) et x 4 = q (modp), où p et q sont 
des nombres premiers. Dans un article de 
1832, Gauss développe l’arithmétique de 
ces entiers généralisés, qui repose sur un 
algorithme de division analogue a celui 
d’Euclide pour les entiers ordinaires : si a 
et b sont des entiers de Gauss, avec b 7^ 0, 
il existe des entiers de Gauss q (« quo- 
tient ») et y (« reste ») tels que a = bq -j- Y 
et que, de plus, N(r) < N(b), où N désigne 
la norme , définie par : 

N (m + in) ~ (m + in ){m — in ) = m 2 + n 2 

(cf. DIVISIBILITÉ). Lorsque le reste r est nul, 
on dit que b divise a ; les unités, entiers de 
Gauss qui divisent 1, sont les quatre 
nombres ± 1 et ± i (racines quatrièmes de 
1 ), et deux entiers de Gauss sont dits 
associés si l’un est le produit de l’autre par 
une unité. Exactement comme pour les 
entiers ordinaires, on établit l’existence du 
plus grand commun diviseur (P.G.C.D.) 
de deux entiers de Gauss, avec une identité 
de Bezout ; on appelle nombre premier de 
Gauss un entier de Gauss qui n’est pas une 
unité et qui n’est divisible que par ses 
associés et par les unités, et on voit qu’un 
tel nombre ne peut diviser un produit de 
facteurs sans diviser l’un d’eux. Il en 
résulte que tout entier de Gauss se décom- 
pose d’une manière essentiellement unique 
en produit de facteurs premiers de Gauss 
(« essentiellement » veut dire ici « à l’ordre 
près des facteurs et à une multiplication 
près par une unité »). Les nombres pre- 
miers ordinaires se classent en trois caté- 
gories : 2 — i( 1 — /) 2 , qui est associé au 
carré du nombre premier de Gauss 1 — i et 


se trouve seul dans sa catégorie ; les 
nombres premiers = 3 (mod 4), qui res- 
tent premiers dans les entiers de Gauss ; 
enfin, les nombres premiers p = 1 (mod 
4 ), qui s’écrivent comme somme de deux 
carrés p - m 2 + n 2 = (m + in)(m — in) 
et se décomposent donc, dans les entiers de 
Gauss, en produit de deux facteurs m ± in, 
tous les deux premiers. Gauss introduit un 
symbole : 

pour la réciprocité biquadratique analogue 
à celui de Le Gendre pour la réciprocité 
quadratique : p étant un nombre entier de 
Gauss et q un entier de Gauss non divisible 
par p, 

&. 

est l’unité i k = q( N (P)~ l V 4 (mod p) (0 ^ k 
< 3), et il vaut 1 exactement dans le cas où 
la congruence x 4 == q (mod p) a une 
solution. La loi de réciprocité énoncée par 
Gauss (et démontrée par Jacobi et Eisens- 
tein) s’énonce alors : si p et q sont des 
nombres premiers de Gauss non associés 
à 1 — on a : 

= (_ l)(N(p)-l)(N( ? )-l)/16^^ . 

La démonstration de Jacobi (1836) utilise 
des «sommes de Jacobi », intimement 
liées à certaines sommes de Gauss ; Eisens- 
tein (1845) a donné d’autres démonstra- 
tions fondées sur la multiplication com- 
plexe de la fonction elliptique si (dont l’une 
est inspirée par une démonstration qu’il 
avait trouvée pour la loi de réciprocité 
quadratique, et qui utilisait la formule qui 
donne sin nx en fonction de sin x). Jacobi 
et Eisenstein ont étudié de même la loi de 
réciprocité cubique, qui donne des rensei- 
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gnements sur la résolubilité d’une 
congruence x 3 = m (mod p) (p nombre 
premier ordinaire, m E Z) ; il faut rempla- 
cer / par la racine cubique imaginaire : 



de 1, et se placer dans le cadre des nombres 
de la forme m + nj avec m, n (E Z. Ces 
nouveaux nombres ont encore des proprié- 
tés arithmétiques analogues à celles des 
entiers ordinaires, car ils admettent un algo- 
rithme de division euclidienne relatif à la 
norme N (m + nj) = (m + nj){m + nj 2 ) 
— m 2 — mn + n 2 ; il y a six unités ± 1 , ± j 
et ± j 2 qui sont les valeurs possibles du 
symbole permettant d’exprimer la loi de 
réciprocité cubique. 

« Dernier théorème de Fermai » 

Avant les travaux de Kummer (cf. infra), 
deux nouveaux cas du « dernier théorème 
de Fermât », appelé aussi « grand théo- 
rème de Fermât », ont été établis par 
Dirichlet, Legendre et Lamé ; il s’agit de 
l’impossibilité de résoudre en nombres 
entiers non triviaux l’équation 
X" -j- y” = z n pour n = 5 (Dirichlet, Le 
Gendre, 1825) et pour n = 7 (Dirichlet, 
Lamé, 1839). Sophie Germain avait mon- 
tré que, dans ces deux cas, l’exposant n 
divise nécessairement l’un des nombres x, 
y OU Z ; pour le cas n = 5, Dirichlet utilise 
les nombres algébriques de la forme 
m + n VJ, avec ra, n G Z, et il établit que, 
si m et n sont premiers entre eux dont l’un 
est pair, si n est multiple de 5 et si 
nr “5 n 2 = (m + n VJ) (m ~ n VJ) est 
une puissance cinquième, alors m + n V 5 
est la puissance cinquième d’un nombre 
algébrique de la même forme. Pour le cas 
n = 7, on utilise une propriété analogue 
des nombres algébriques de la forme 
m + n V— 7 avec m, n G Z. 


En 1847, Lamé crut avoir une démons- 
tration du dernier théorème de Fermât 
pour tout exposant n ^ 3 : il décomposait 
x" + y n en n facteurs x + r*y, avec 
0<a^«-letr racine n-ième de 1, et 
admettait que, dans le cas où x et y sont 
premiers entre eux, chacun de ces facteurs 
devait être une puissance n-ième s’il en est 
ainsi de leur produit x n -f- y n — Z n . 
Comme Liouville le reconnut aussitôt, la 
décomposition unique en facteurs pre- 
miers pour les nombres de la forme 
a 0 + a x r + + a n _j r" _/ (a, G Z), que 

Lamé admettait implicitement, n’était pas 
forcément justifiée. Il se trouve que Kum- 
mer, qui étudiait ces nombres depuis 1843, 
avait publié dès 1844 un article dans lequel 
il montrait que la décomposition unique en 
facteurs premiers n’a pas lieu pour n — 23. 

L’intérêt de Kummer pour les « entiers 
cyclotomiques » du type ci-dessus prove- 
nait sans doute autant de son désir de 
généraliser les lois de réciprocité connues 
que d’efforts pour démontrer le dernier 
théorème de Fermât. Cependant, sa théo- 
rie lui fournit une démonstration dudit 
théorème pour toute une classe d’expo- 
sants n premiers, qu’il appela réguliers ; le 
plus petit nombre premier irrégulier est 37 
(malheureusement, on ne sait pas s’il existe 
une infinité de nombres premiers régu- 
liers). Rappelons que le grand théorème de 
Fermât a enfin été démontré en 1993. 

2. Les « nombres idéaux » 

de Kummer 

Entiers cyclotomiques 

Considérons, avec Kummer, un nombre 
premier impair A et une racine h-ième 
imaginaire (X de 1 ; ainsi : 

cd — 1 . , 

—y = d*- 1 + a k ~ 2 + + a + 1 = 0. 
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L’équation de degré À — 1 précédente est 
irréductible sur le corps Q des nombres 
rationnels, donc les nombres 1, a, a 2 , . . . . 
(X A 2 sont linéairement indépendants sur 
Q ; les entiers cyclotomiques correspon- 
dant à A sont les nombres de la forme : 

/(a) = a 0 + ûqa + ... + a k _ 2 a K ~ 2 , 

où Æq, a, ü k __2 (E "Z, c’est-à-dire les élé- 

ments du sous-anneau Z[a] de C engendré 
par a. Il résulte des remarques précédentes 
que l’écriture d’un entier cyclotomique 
sous la forme/(a), polynôme en a de degré 
^ À 2 à coefficients entiers, est unique (il 
n’en serait pas de même avec des polynô- 
mes de degré ^ A 1 qu’il est parfois utile 
d’ introduire) . L’ anneau Z[«] des entiers 
cyclotomiques ne dépend pas du choix de a 
parmi les racines A-ièmes imaginaires de 1 , 
puisque toutes ces racines sont les puissan- 
ces de l’une d’elles ; à l’entier cyclotomique 
f(a), on associe ses conjugués f (a 2 ), f ( a 3 ), 
/(a À *) et sa norme 
N/ (a) =/ (a) /(a 2 ) . . . y (ot A '), qui est un 
entier ordinaire car elle ne change pas 
lorsqu’on remplace a par une de ses puis- 
sances. Comme Ot 7 et a K 1 sont complexes 
conjugués, / (a 7 )/ (tt A 7 ) est réel positif, et 
N/ (a) est donc un entier positif ; on vérifie 
facilement que la norme est multiplicative : 
N(/'(a)g(a)) = N/ - (a)* Ng(a). On dit 
qu’un entier cyclotomique/ (a) en divise un 
autre /z(a) s’il existe un entier cyclotomique 
g(a) tel que h(a) = f(a)g(a) ; on dit que 
/fi (a) et /fi(a) sont congrus modulo /(a), et 
on écrit h, (a) = /fi(a) (mod/(a)), si 
/fi (a) — h 2 ( a) est divisible par f (a). Kum- 
mer appelle unités les entiers cyclotomiques 
dont la norme est 1, c’est-à-dire ceux qui 
divisent 1 ; par exemple les a 7 sont des 
unités, de même que les quotients : 

1 — a 7 , . . 

-i = i+ a+a 2 + + a ' -1 

1 - a 


(avec 1 ^ j ^ A-l), car N (1 —a 7 ) 
= (1 — a 7 )( 1 — a 27 ) ... (1 — a (A l)7 ) est la 
valeur, pour x = 1 , du polynôme (x — OC 7 ) 

(x — a (A 1)7 ) = 1 + x + x 2 + ... + x* - 
1, ce qui donne N( 1 — a 7 ) = A indépen- 
damment dej. Des calculs précédents, on 
titre aussi : 


A 


= (1 — ex)*- 1 


1 — a 2 
1— a 


1— a 3 
1 — a 


1 — cP" 1 
T - a _ ’ 


ainsi À se décompose, dans l’anneau des 
entiers cyclotomiques, en le produit de 
(1 a) À_l par une unité. 

On dit qu’un entier cyclotomique //(a) 
est premier s’il n’est pas une unité et s’il ne 
peut diviser un produit /(a)g(a) sans 
diviser l’un des facteurs f(a) ou g(a) ; si 
h(a) est premier, il en est de même de ses 
conjugués h(a J ) et des produits de ces 
conjugués par des unités. Par exemple, 
1 a est premier : en effet, si 1 a divise 
un entier rationnel w, A — N( 1 — a) divise 
N m — m K ~K c’est-à-dire que A divise m 
(puisque A est premier) et, inversement, les 
multiples de A sont divisibles par 1 a ; si 
1 - a divise f(OL)g(a), c’est-àdire 
/ (o.)g(a) = 0 (mod (1 — a)), comme 
a= 1 (mod(l-a)), on a /(l)g(l) == 0 
(mod (1 a)), donc f(l) ou g(l) est divi- 

sible par A et, par suite, f(a) e 0 ou 
g (a) = O (mod (1 — a)). Soit /z(a) un 
entier cyclotomique de norme A ; le nom- 
bre premier cyclotomique 1 a divise 

N(/ï(a)), donc divise l’un de ses facteurs 
h( a 7 ) (1 ^ j ^ A — 1 ), et, comme 
N(/ 7 (a 7 )) = N(/?(a)) = A = N( 1 ^ a), le 
quotient est une unité : h(a) est donc 
encore premier et c’est le produit d’un des 
conjugués de 1 — a par une unité. 

Considérons maintenant un entier 
cyclotomique h( a) dont la norme soit 
un nombre premier q 7^ A ; ainsi 
q = N(/*(a)) = h( 1 ) À 1 (mod (1 -a)), d’où, 
d’après ce qui précède q = h( 1) Â_1 = 1 
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(mod X) (théorème de Fermât ; cf. divi- 
sibilité). On voit comme ci-dessus que 
les entiers rationnels divisibles par h(a) 
sont les multiples de q ; pour continuer le 
raisonnement et montrer que h( a) est 
premier, on va prouver qu’il existe un 
entier rationnel U tel que a = u 
(mod h(a)), et on lui fera jouer le rôle que 
jouait 1 pour 1 — a. Posons i = (q 1 )/X 
et k = y’, où y est une racine primitive 
modulo q ; la congruence — 1 (mod q ) 
a pour solutions x = 1, k, k 2 , ... . k k ~* 
(mod q ), donc x k 1 + + ... 

+ x + 1 = (x k)(x k 2 ) (x k k ~ l ) 
(mod q). On en déduit facilement que 
h(k)h(k 2 ) h(k k ~ x ) = 0 (mod q ), puisque 
N(/z(a)) = q ; par suite, q divise l’un des 
nombres h(k J ) et le polynôme h(x) est 
divisible modulo q par x — W. On prend 
U = kk de sorte que h(a m ) est divisible 
modulo q par <j m u pour 1 ^ m ^ X— 1 , 
et (a u)h(a 2 )h(ü?) . h(a k ~ l ) est divisible 
modulo q par : 

N(a-u) = ' “ . 

1 — u 

lui-même divisible par q = h{a)h{a 2 ) 
h( a À_1 ) ; cela prouve bien que a — u est 
divisible par h(a). Il en résulte alors que, 
si h(a) divise f (a)g(a), ü divise f (u)g(u) 
qui est donc un multiple de q ; ainsi q divise 
f(u) ou g(u), ce qui signifie que h(a) divise 
f(a) ou g(a) : on voit donc que h(a) est 
premier. Si h, (a) est un autre entier 
cyclotomique de norme q , h(a), qui divise 
q , divise l’un des conjugués de h, (a), et le 
quotient est de norme 1 ; ainsi, h, (a), qui 
est aussi premier, est le produit d’un des 
conjugués de h(a) par une unité. Les 
différents facteurs premiers h(a), /?(ot 2 ), .... 
h(a k - ] ) trouvés pour q dans les entiers 
cyclotomiques sont essentiellement dis- 
tincts, c’est-à-dire qu’aucun d’eux n’en 
divise un autre ; si en effet h(a J ) divisait 


h(a m ), de a J = U (mod //(a 7 )) on tirerait 
a 7 = u = a m (mod h(a m )), donc 
q = N(h(a m )) diviserait a m ) = 

N(1 a" 1 " 7 ), ce qui exige m =j (mod X) 

(sinon N( 1 — a m ~ J ) = X). 

Kummer a fait des calculs systémati- 
ques de nombres premiers cyclotomiques 
h(a) de norme un nombre premier ration- 
nel q , et des entiers u correspondants, en 
prenant de petites valeurs de A. Par exem- 
ple, pour X = 5, fl f 2 a pour norme 11, 
a — 2 a pour norme 31, etc. ; pour 

X = 7, — a 4 + a 2 + la pour norme 29 et 
divise fl + 13, a + 2 a pour norme 43. 
etc. Ses tables donnent, pour A ^ 19, les 
facteurs premiers cyclotomiques de tous 
les nombres premiers q = 1 (mod A) 
inférieurs à 1 000. Pour A = 23, on voit 
que 47 n’est la norme d’aucun entier 
cyclotomique, et n’admet donc aucun divi- 
seur premier cyclotomique ; cependant : 

4 23 1 

N ( a - 4 ) = _ ■■■ =0 (mod 47), 

et on calcule que N(1 a + a 2 ) = 
47 • 139 et N(a !0 + a -10 + a 8 -f -a 
8 + a 7 -f- a -7 ) = 47 2 , 47 étant le produit 
de la moitié des conjugués de ce dernier 
nombre. On en déduit deux décomposi- 
tions distinctes de 47 . 139 en produits 
d’entiers cyclotomiques irréductibles, mais 
non premiers. L’idée des « facteurs pre- 
miers idéaux » de Kummer consiste à 
associer à fl ™ 4 un tel facteur : par 
définition, un entier cyclotomique / (a) est 
divisible par ce facteur sif(4) est divisible 
par 47, mais le facteur lui-même n’existe 
pas en tant que nombre. 

Si h(a) est un nombre premier cyclo- 
tomique quelconque, il divise N(/z(a)), 
donc l’un des facteurs premiers rationnels 
y de cet entier ; montrons que les entiers 
rationnels divisibles par h(a) sont exacte- 
ment les multiples de q : si h(a) divise 
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l’entier m, il divise le P.G.C.D. (m, q) qui 
vaut 1 (exclu car h(a) n’est pas une unité) 
ou q , et par suite q divise m. Lorsque 
q A, on a / 1 = 1 (mod A) par le petit 
théorème de Fermât ; soit f le plus petit 
entier ^ 1 tel que / = 1 (mod A). On sait 
quefest un diviseur de A — 1 ; le cas f = 1 
a été traité ci-dessus, et nous allons exa- 
miner le cas général en cherchant des 
entiers cyclotomiques congrus à des 
entiers rationnels modulo h(a). D’après le 
théorème de Fermât, on a : 

X* — X = (x — l)(x —2) ... (x — q) (modq); 
en prenant x = /( a) entier cyclotomi- 

que tel que / (a^) = / (a), donc 

f(o) = f(a q ) =f(a) q (modq), on voit 
que h(o) divise l’un des facteurs / (a) — w, 
c’est-à-dire que /(a) = U (mod /z(a)). La 
transformation a * 0^ laisse invariantes 
les e = (A 1)// périodes % Hi» • • • • H^-i 
de longueur/, et il existe donc des entiers 
rationnels u 0 , U j, . . . . u e _ j tels que r|, ~ 
(mod h(a)) pour 0 ^ i ^ e *- 1 ; autre- 
ment dit, l’équation de degré e (à coeffi- 
cients entiers rationnels) dont les solutions 
sont les périodes de longueur f se décom- 
pose complètement modulo q en 
(x - u 0 )(x - U,) (x - u e 

Pour qu’un entier de la forme a, + fl] 
Hï -F + ci e \\ e (q e = q 0 , les indices des 
périodes sont pris modulo e), avec 

a „ soit divisible par h(a ), il faut 

et il suffit que t/ 0 + a x u x + + a e U e soit 
divisible par q ; chacun des entiers cyclo- 
tomiques formés des périodes q , est congru 
modulo h(o) à un unique entier rationnel 
appartenant à [0, q — 1]. Comme a est 
racine d’une équation de degré / à coeffi- 
cients formés des périodes de longueur f 
tout entier cyclotomique écrit d’une 
manière unique sous la forme 
ip(n) + avpi(n) + + où les 

coefficients 4/q) sont formés des périodes 


de longueur /, et il est donc congru modulo 
h(o) à un unique entier cyclotomique de la 
forme b 0 -f- b x a + + 6/_ \of~\ où les 
coefficients bj sont des entiers rationnels de 
l’intervalle [0, y — 1] ; les qf entiers cyclo- 
tomiques ainsi décrits forment donc un 
système de représentants des classes 
modulo h((X). Les entiers Uj au moyen 
desquels on peut tester la divisibilité par 
h(o) sont liés par des relations modulo q 
qui proviennent des relations entre les 
périodes : si n,ri/= Cl 0 + a x x\ x + + a e J] e9 
on doit avoir UjUj= a Q + a x U x + + 
a e U e (modq). 

Considérons maintenant un nombre 
premier rationnel y ^ A quelconque, et 
soitfle plus petit entier ^ 1 tel que qf = 1 
(mod À) ; on pose encore e = (A ™ 1)// Il 
se peut que q ne soit divisible par aucun 
nombre premier cyclotomique, comme 
nous l’avons vu dans le cas où À = 23 et 
q = 47 ; mais on peut encore démontrer 
que l’équation de degré e dont les racines 
sont les périodes de longueur f se décom- 
pose modulo ^ en e équations de degré 1, 
et les e entiers rationnels, racines modulo q 
de ces congruences, vont permettre de 
définir une relation de congruence dans les 
entiers cyclotomiques, si on les associe 
convenablement aux e périodes de lon- 
gueur /. Pour ce faire, on considère les 
entiers cyclotomiques u — avec u entier 
rationnel tel que : 

e-i 

n («— i/) 

[• = 0 

soit divisible par q (0 ^ u ^ q 1), et on 
forme un produit, noté v I‘(r|), de tels nom- 
bres avec des u et des choisis tels que 
'L(q) ne soit pas divisible par q # mais que, 
pour tout i, il existe u t tel que (u, 
q,) v I‘(n) = 0 (mod q) ; l’entier rationnel Uj 
est déterminé d’une manière unique par 
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cette condition, car si on en avait deux, u t 
et u\ on aurait (u t — w')'T(n) = 0 (mod q), 
avec Uj — u 0 (mod q ), 

donc inversible modulo p , ce qui donne- 
rait V I (q) = 0 (mod q ). Soit 
FlnCbHh He i) = 0 une relation polyno- 

miale quelconque (à coefficients entiers) 
entre les périodes ; on tire de ce qui précède 

que F(« 0 , H, U, |) v I (r)) = 0 (mod q), 

d’où F(« 0 , «|, .... = 0 (mod q), puis- 

que F(i/q, Mj, • • • • est un entier ration- 
nel et que l ï (q) 0 (mod q). Kummer 

associe à la suite ( î/ 0 , Wj, . . . . u c _\) un « nom- 
bre premier idéal » divisant q , qui n’est pas 
du tout un nombre, mais bien une relation 
d’équivalence entre entiers cyclotomiques, 
pour laquelle chaque période q i de lon- 
gueur /est équivalente à l’entier rationnel 
U j correspondant. Cela détermine entière- 
ment la relation d’équivalence, si on lui 
impose d’être compatible avec la structure 
d’anneau des entiers cyclotomiques (addi- 
tion et multiplication ; cf. anneaux et 
algÈbres) ; explicitement, des entiers 
cyclotomiques sont équivalents si leurs pro- 
duits par U’(n) sont congrus modulo q. On 
montre encore que les / entiers cycloto- 
miques b 0 + b { a -)- If . + bf_ |G^ _Ï , avec 
0 ^ b j ^ q - 1 pour j = 0, 1, f-1, 

forment un système de représentants des 
classes pour la relation d’équivalence consi- 
dérée, et qu’un produit d’entiers cycloto- 
miques ne peut être équivalent à 0 sans que 
l’un des facteurs le soit : autrement dit, 
l’anneau quotient est intègre et, comme il 
est fini, c’est un corps à çf éléments. 

Le groupe de Galois de l’équation dont 
les racines sont les e périodes de longueur 
fest formé des permutations circulaires de 
ces périodes (cf. corps) ; on peut donc 
transformer la suite (w 0 , Wj, . . . . u e _ j) par 
permutations circulaires, ce qui définit en 
tout e « nombres premiers idéaux » divi- 
sant q. On peut vérifier qu’ils sont tous 


distincts, et que ce sont les seuls possibles ; 
en ce sens, q se trouve décomposé, dans les 
entiers cyclotomiques, en e = (À 1 )// 
facteurs premiers distincts, tous conju- 
gués, mais pouvant être idéaux : pour 
qu’un entier cyclotomique soit divible par 
q , il faut et il suffit qu’il soit divisible par 
chacun des e facteurs de q , c’est-à-dire 
équivalent à 0 pour chacune des 2 relations 
d’équivalence correspondantes. Par exem- 
ple, le nombre l I‘(q) qui a servi à construire 
(w 0 , Wj, u e _ j) est divisible par tous les 

facteurs de q sauf celui qui est associé à 

(w 0 , Wj, Notons que, lorsque 

f — A ™ 1, c’est-à-dire lorsque q est une 
racine primitive modulo À, e = 1 et q reste 
premier dans les entiers cyclotomiques. 

On précise la définition des « nombres 
premiers idéaux » en spécifiant avec quelle 
multiplicité ils divisent tel ou tel entier cyclo- 
tomique. Soit, comme plus haut, 'T(n) un 
entier cyclotomique formé des périodes de 
longueur f et divisible par tous les facteurs 
d’un nombre premier rationnel q d’ordre 
f modulo À, sauf celui qui correspond à une 
suite (w 0 , Wj, u e _j) d’entiers rationnels ; 
on définit une valuation v sur l’anneau des 
entiers cyclotomiques en posant : 

vtf(oî)) = sup { n EN 1/ (a)^X T l)'’ s 0 (mod?")} 

(cf. algèbre topologique) . Lorsque le fac- 
teur de q associé à (w 0 , u j, . . . . w j) est un 
vrai nombre premier cyclotomique /î(cx), 
les nombres de valuation n sont ceux qui 
sont divisibles par b(a) n mais pas par 
/7(a) ,î+1 . La théorie de Kummer consiste 
en définitive à remplacer les nombres 
premiers cyclotomiques, qui n’existent pas 
toujours, par des valuations ; au moyen de 
ces valuations, on peut énoncer un critère 
de divisibilité pour les entiers cy cio to ini- 
ques, qui joue le rôle de la décomposition 
en facteurs premiers lorsque celle-ci est 
possible. 
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Théorème. Soit f (a) et g(a) deux entiers 
cyclotomiques. Pour que /(a) divise g(a), 
il faut et il suffit que, pour toute valuation 
V associée à un « nombre premier idéal », 
on ait v(/(a)) ^ v(g(a)). 

La condition est évidemment néces- 
saire, car les valuations y ne prennent que 
des valeurs positives sur les entiers cyclo- 
tomiques ; pour voir qu’elle est suffisante, 
on observe que /(a)Jg(a) équivaut à 

N/(a)| g(a)f (a 2 )/ (a 3 ) . ../ (a''" 1 ), donc on 

peut se ramener au cas où f(a) est un 
entier rationnel, en ajoutant 

vif (a 2 ) . ../(a* -1 )) à vif (a)) et à v(g(a)). 
On décompose alors f(a) en un produit 
P\Pl Pn de nôtres premiers rationnels 
(non nécessairement distincts), et on se 
ramène, par récurrence sur n , à montrer 
que la propriété est vraie pour /( a) = q , 
nombre premier rationnel, ce qu’on a déjà 
vu plus haut. 

En résumé, un « nombre premier idéal » 
Q est défini par la donnée d’un nombre 
premier rationnel q ^ A et d’une corres- 
pondance convenable entre les e périodes 
de longueurf(ordre de q modulo X) et les 
racines modulo q de l’équation de degré e 
qui donne ces périodes ; il faut ajouter à cela 
le nombre premier exceptionnel 1 a, uni- 
que diviseur de \ avec la multiplicité A — 1. 
A l’entité Q, on associe une valuation vo sur 
l’anneau des entiers cyclotomiques ; si 
V Q (/(«)) ) 1, on a/(a) = 0 (mod q) (et 
inversement), donc Q divise N(/(a)), qui 
est ainsi multiple de q : on a donc 
v <ff (°0) = 0 sauf pour un nombre fini de 
Q qui divisent les facteurs premiers ration- 
nels de N (f (a)). À l’entier cyclotomique 
f(a), on associe le symbole : 

ld = (/(a)), 

Q 

que l’on appelle le diviseur de f (a), et on 
voit, grâce au théorème précédent, que 


deux entiers cyclotomiques n’ont le même 
diviseur que si l’un est le produit de l’autre 
par une unité (pour une unité e(a), on a 
Vq(e(a)) = 0 quel que soit Q). D’une 
manière générale, on appelle diviseur un 
symbole P/ ,] P 2 " 2 . P/ k , où P„ P 2 , . . . . P^ 
sont des « nombres premiers idéaux » (que 
l’on peut identifier aux valuations corres- 
pondantes v p .) et n b n 2 , .... «^6 N ; on 
peut multiplier entre eux les diviseurs 
(mais pas les additionner), et la multipli- 
cation est une loi commutative et associa- 
tive admettant comme élément neutre le 
diviseur (1) des unités. Si A est un diviseur, 
on note encore vo(A) l’exposant du « nom- 
bre premier idéal » Q dans A ; à deux 
diviseurs A et B, on associe un diviseur 
P.G.C.D. (A, B), pour lequel : 

v q ((A, B» = inf(vg(A), v q (B)) 

quel que soit Q. Par exemple un « nombre 
premier idéal » P, facteur d’un nombre 
premier rationnel q , s’écrit comme le 
P.G.C.D. (^, ip(r|)) des diviseurs (y) et 
(w(n)), où tp(q) est un entier cyclotomique 
formé de périodes de longueur f (ordre de 
q modulo A) tel que Vp(lp(q)) = 1 et 
VQ(lp(q)) = 0 pour les autres facteurs 
idéaux Q de q ; il est facile de construire un 
tel ip(r|) en utilisant le nombre B’(n) intro- 
duit plus haut et ses conjugués. 

Soit (J un automorphisme de conju- 
gaison des entiers cyclotomiques, 
défini par une substitution a ' ► (X J ; on 
fait opérer a sur les diviseurs en posant 
a( P,” 1 P 2 ” 2 ... P/ k ) = (j(P j /'l (7(P 2 )"2 
a(P /t )" k , et o(P) = (p, oip(r|)) si 
P = (/?, vp(q)). La norme d’un diviseur A 
est le diviseur NA = A . o(A) a A-2 (A), 
où (J est un automorphisme de conjugaison 
défini par a >— ► a T , y racine primitive 
modulo A ; on voit facilement que c’est le 
diviseur d’un entier rationnel que l’on note 
encore NA. L’entier NA s’interprète 
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encore comme le nombre de classes 
d’entiers cyclotomiques pour la 
congruence modulo A, en définissant 
f(a) = g(a) (mod A) par la condition : A 
divise (J (a) — g(a)) ; pour le voir, on se 
ramène, grâce à une généralisation du 
théorème des restes chinois (cf. équations 
diophantiennes), au cas où A = P /J est 
une puissance d’un diviseur premier 
P = (p , ip(r|)), et on établit, par récurrence 
sur n , que tout entier cyclotomique est 
congru modulo P" à un nombre de la 
forme : 

a o + + ... + a„_|iKn)' ,_l . 

où les a, sont des entiers cyclotomiques 
déterminés d’une manière unique 
modulo P. Ainsi le nombre de classes 
modulo P" est la puissance n - ième du 
nombre de classes modulo P, et on est 
ramené à n = 1, soit A = P; alors P a 
seulement e conjugués distincts 
(/?, Œ'ip(n)), avec 0 ^ y < e — 1, qui sont 
répétés chacun / fois, et le produit de ces 
conjugués est p : on a donc NP = pi qui 
est bien le nombre de classes modulo P. Le 
cas où P = 1 C( est à part ; il y a 
A = N( 1 a) classes modulo (1 a), 

représentées par 0, 1, .... À — 1. 

Classes de diviseurs 

Les diviseurs premiers ont été définis 
comme facteurs de nombres premiers 
rationnels ; par suite, tout diviseur A divise 
un nombre véritable : il existe un diviseur 
C tel que AC soit le diviseur d’un entier 
cyclotomique. On appelle prindpüUX les 
diviseurs d’entiers cyclotomiques. Consi- 
dérons des diviseurs A, B, C tels que AC 
et BC soient principaux, et soit D un 
diviseur tel que AD soit principal ; on a 
donc AC = if (ex)), BC = (g(a)) et 
AD = (/l(a)), et on voit, en se servant du 
théorème du chapitre précédent, que /(a) 


divise g(a)/z(a) dont le diviseur est ACBD. 
Le quotient est un entier cylotomique de 
diviseur BD, qui est donc encore princi- 
pal ; si, donc, pour un diviseur C, AC et 
BC sont tous deux principaux, alors AD et 
BD sont principaux en même temps pour 
un diviseur quelconque D. Selon Klim- 
mer, on dit que les diviseurs A et B sont 
équivalents s’il existe un diviseur C tel que 
AC et BC soient principaux ; les diviseurs 
principaux sont ceux qui sont équivalents 
au diviseur (1). La relation d’équivalence 
est compatible avec la multiplication des 
diviseurs : si A, (resp. A 2 ) est équivalent 
à B, (resp. B 2 ), AjA 2 est équivalent à B]B 2> 
car si AjA^C est principal, il en est de 
même de B]A 2 C = A 2 BjC (A, équivalent 
à B,), donc aussi de B^BjC (A 2 équivalent 
à B 2 ). Pour chaque diviseur A, il existe un 
diviseur C tel que AC soit équivalent à 
l’élément neutre (1) de la multiplication ; 
par suite, la multiplication des diviseurs 
induit, sur l’ensemble des classes de divi- 
seurs, une structure de groupe commutatif 
dont l’élément neutre est la classe des 
diviseurs principaux. 

Un théorème fondamental de Kummer 
affirme que le groupe des classes de 
diviseurs est fini. Sa démonstration repose 
sur deux lemmes. 

Lemme 1. Il n’y a qu’un nombre fini de 
diviseurs de norme inférieure à un 
entier M fixé. 

On a en effet N(( 1 — a)" () P." 1 P/ 2 

p/k) />/'"' A 2 " 2 ... A kV <M, 

donc les p t et les n t ne peuvent prendre 
qu’un nombre fini de valeurs ; chaque p t 
n’a qu’un nombre fini de facteurs 
premiers idéaux, donc les P, ne prennent 
qu’un nombre fini de valeurs, ce qui 
démontre le lemme. 

Lemme 2. Soit p = (A — l)/2 ; pour 
tout diviseur A, il existe un diviseur C de 
norme tel que AC soit principal. 
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Soit en effet c le plus petit entier tel que 
(c + l) A -> ^ NA +1 ; les entiers cyclo- 
tomiques ci\OL + a 2 a 2 + + ah — la” 1 
tels que 0 ^ a, ^ C (i = 1, .... A — 1) sont 
en nombre supérieur à NA, donc il y en a 
deux qui sont congrus modulo A et on 
prend pour AC le diviseur de la différence 
de ces deux nombres, qui s’écrit 

b } a + b 2 a 2 + + b k _ 1 =/(a) 

avec | b t c. On a : 

JJ/(a'y(a-') («-'))" 

(inégalité de la moyenne géométrique, 
applicable aux nombres réels/ (a')/ (0( ')), 
et on calcule facilement que : 

h-i 

g (/(a 1 )/ (a- 1 )) = X £*?-( X*') 2; 

donc : 

à— i 

^/(«')/(a-')) < Â(X-iy2 
i - 1 

et : 

/(«')/(«-')) < lc\ 

d’où N(/(a)) ^ 1 < À M NA d’après le 

choix de c, ce qui signifie que NC ^ À JI . 

En appliquant ces lemmes, on voit qu’il 
existe un nombre fini de diviseurs C„ C 2 , 
,,,, C,„ tels que, pour tout diviseur A, run 
des AC, (1 ^ j ^ ni) soit principal ; donc 
il y a au plus ni classes de diviseurs 
distinctes. 


3. Unités 

Dans une série de courtes notes, Dirichlet 
(1841-1846) a étudié les unités dans des 
anneaux de nombres algébriques de la 


forme Z [0], où 0 vérifie une équation irré- 
ductible x? 1 + fljx" -1 ++ a,, = 0 à 
coefficients a, entiers rationnels ; si les raci- 
nes de cette équation sont 0, 0j, . . . . 0„_|, les 
conjugués d’un élément f’(B) de Z[0] sont 
/(0j), .... /(0„_|), et sa norme est le produit 

N</(0)) =./W(0 1 ) • Les unités 

de Z[0] sont les éléments /(0) de norme ± 1 
(la norme est toujours un entier rationnel, 
mais elle peut être négative dans ce cas géné- 
ral) ; parmi les unités, les racines de 1 qui 
appartiennent à Z[0] sont caractérisées par 

|/(9)|= |/(0,)|= =|/(0„..,)|= I 

En effet, si f (0) vérifie ces conditions, il en 
est de même de ses puissances/ (0/, kE:N, 
dont tous les conjugués restent donc bor- 
nés. Or l’ensemble des éléments de Z[0] 
dont les conjugués sont tous majorés par 
une constante M est fini, car ces éléments 
sont les racines d’un nombre fini d’équa- 
tions de degré n (leurs coefficients sont les 
fonctions symétriques élémentaires des 
conjugués, donc ce sont des entiers ration- 
nels majorés en fonction de M et de n) ; il 
n’y a donc qu’un nombre fini de puissances 
f(d) k distinctes, et/(0) / = 1 pour 1 conve- 
nable. Les racines de 1 appartenant à Z[0] 
forment un groupe fini cyclique pour la 
multiplication ; la finitude provient du 
résultat précédent, et le caractère cyclique 
du fait que, pour tout /, il y a au plus 
/ solutions de l’équation x l = 1 dans C, 
donc dans Z[0] (cf. groupes - Généralités). 
L’énoncé fondamental de Dirichlet est le 
suivant : 

Théorème. Soit jq le nombre de racines 
réelles de l’équation en 0, et 2 r 2 le nombre 
de ses racines imaginaires (de sorte que 
Y, + 2 r 2 = n). Il existe y — y, + 1 

unités fondamentales ^(0), • • • • E-(O) 

telles que toute unité s’écrive, d’une 
manière unique, sous la forme 
où 0 ) e s t une 
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racine de 1 et où les exposants fl. appar- 
tiennent à Z. 

Autrement dit, le groupe multiplicatif 
des unités est le produit du groupe des 
racines de 1 par un groupe isomorphe à Z r . 

On démontre le théorème en utilisant le 
plongement logarithmique ainsi défini : on 
indexe les racines de l’équation en 0 de 
manière que 0 b 0 ? , . . . . 0 rl soient réelles et 
que 0/+r 2 soit complexe conjugué de 0 ; 
pour Y j + 1 ^ j ^ Tj + *2 ; °n note a l° rs 
Lé(0) le vecteur (ln é?( 0,-) |) de R n+r2 
(1 ^ ^ fi + r 2 ). Ainsi e(0) i— > ► Le(0) est 

un homomorphisme du groupe des unités 
dans R n+r2 , et son noyau est le SOUS- 
groupe formé des racines de 1 ; l’image est 
un sous-groupe de R n+/ ' 2 , et on aura 
démontré le théorème en prouvant que 
cette image est un groupe libre de rang r. 
Or l’image de L est discrète, car si Le(0) 
reste borné, tous les conjugués de e(0) sont 
majorés en valeur absolue par une cons- 
tante et e(0) ne peut prendre qu’un nombre 
fini de valeurs ; on sait qu’un sous-groupe 
discret de R v est libre de rang ^ s (cf. 
algèbre topologique) . En écrivant que la 
norme de e(0) est ± 1, on voit de plus que 
l’image de L est contenue dans l’hyperplan 
d’équation : 



ce qui majore son rang par rj H— - — 

1 = r ; cet hyperplan se projette isomor- 
phiquement sur R r , et on note L la 
composée de L avec la projection. Il reste 
à voir que l’image de L est de rang r, 
c’est-à-dire que l’orthogonal de cette image 
dans le dual de R ? est 0 (cf. algèbre 
linéaire et MULTILINÉAIRE) ; on obtient ce 
résultat grâce au théorème de Minkowski 
(cf. approximations diophantiennes) , qui 
permet de prouver l’existence d’un élé- 


ment non nul /(0) de Z[0] vérifiant les 
inégalités |/(0,) ^ K, (1 ^ < n), avec 

des nombres réels positifs Kj, k 2 , K„ tels 
que K j+ ,. 2 = Kj pour r, + 1 < j < r, + r 2 
et que le produit K l k 2 K,, soit assez 
grand. Si /(0) = a 0 + a,0 + + a n 
10" *, ces inégalités s’interprètent comme 
un système d’inégalités définies par des 
jauges de Minkowski sur l’espace 
RH X C r2 — R" des vecteurs 

(æ 0 , a„ . . . . a, ]) ; la matrice des jauges est 
(0/)i p et la condition d’exis- 

tence de /(0) est que KjK 2 K n soit plus 
grand que la valeur absolue A du déter- 
minant de cette matrice. L’élément f (0) 
ainsi obtenu est de norme 
/(0j)/(0 2 ) . ../ (0 W ) au moins 1 en valeur 
absolue (entier non nul), ce qui donne 
|/(0/) ^ K J K pour i — 1, 2, ..., n , en 
posant K = KjKo K,. Soit cp une forme 
linéaire non nulle sur R r et x le vecteur de 
coordonnées(ln K b lll K 2 , In K,) ; les iné- 
galités obtenues donnent cp(x) — 
<p(L(/ (0))) ^ ||<p|| ln K (où | <p|| est la 
somme des valeurs absolues des coeffi- 
cients de (p). On prend M > || cp || ln K fixé, 
et, pour chaque entier h, on choisit 
K b k 2 , . . . . k,. de manière que cp(x) = 2 M h ; 
on peut alors trouver k,. + 1 assez petit 
pour que ||<p || ln (KjK 2 K ;j ) < m , et 
on a un élément /,(0) correspondant dans 
Z[0] qui vérifie (2 h 1)M < cp(L(/(0))) 
< (2 h 1)M, de sorte que la suite 

(cp o L(/j(0)))^ est strictement croissante. 
Par ailleurs, les normes N/(0) restent 
majorées par K, donc //,(0) divise un entier 
rationnel de l’intervalle fini [1, K] ; on en 
déduit qu’il existe des indices h et / tels que 
.m = «(©i, où c(0) est une unité, et 
alors cp(L(É>(0))) = cp(L(/(0))) 

- <p (L(/;,(0))) 0, comme on voulait. 

Le groupe des unités n’est donc fini (et 
réduit aux racines de 1) que si = 1 et 
r 2 = 0, ce qui donne fl = 1 et 0 G Z, ou 
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bien si Y, = 0 et r 2 = 1, ce qui donne 
n — 2 ; dans ce cas, on peut se ramener à 
0 =V'— D, avec D entier rationnel positif 
non divisible par 4, ou bien à 
0 — (1 + vCTÏ))/2, avec D = 3 (mod 4). 
On a vu, par exemple, que le groupe des 
unités de Z [ i ] est d’ordre 4, tandis que celui 
de Z [/], j racine cubique 

de 1, est d’ordre 6 (théorie de Kummer 
pour A = 3). Lorsque 0 = VT), avec D 
entier rationnel positif sans facteur 
carré, on a jq = 2, r 2 = 0 et le groupe des 
unités est de rang r = 1 ; toute unité 
s’écrit ± (T + UVU)", où n G Z et où 
T + UVT) est une unité fondumentale. 
Cela revient à dire que l’équation de Pell 
x 2 — Dr = N(x + }4/D ) — ± 1 est 

résolue en posant X + y^D 
= ± (T + U VU)", et on a donc démontré 
l’existence de solutions pour cette équa- 
tion. Pour les entiers cyclotomiques, on a, 
avec les notations antérieures, = 0 et 
r 2 — (A l)/2 = p, donc le groupe des 
unités est de rang r = p — 1, qui est ^ 1 à 
partir de A = 5 ; la difficulté de trouver des 
lois de réciprocité supérieures sur le 
modèle des lois pour les degrés 2, 3 et 4 est 
liée au caractère infini de ces groupes 
d’unités. Pour A = 5, Y = 1 et on peut 
prendre le nombre réel a — (— Ot 4 comme 
unité fondamentale ; pour A = 7, r = 2 et 
un système d’unités fondamentales (réel- 
les) est donné par (a + a -1 , a 3 -f- a -3 ). 
Pour A = 11, r = 4, et on a le système 
fondamental (a -f- a -1 , a 2 -j- or 2 , a 4 + 
a -4 , a 3 + a 3 ). Dans le cas cyclotomique 
général, Kummer considère le sous-groupe 
du groupe des unités engendré par ± 1, a 
et les unités (1 ™ «0/(1 — a), en prenant 
/ = y’, y racine primitive modulo À et 
l^i^p = (A— l)/2 ; ce sous-groupe a 
le même rang r — p — 1 que le groupe des 
unités, et le quotient est donc d’ordre fini 
h 2 . En s’inspirant du travail de Dirichlet sur 


le nombre de classes de formes quadrati- 
ques (cf. la partie A ci-dessus - Théorie 
analytique des nombres), Kummer a donné 
une formule pour l’ordre h du groupe des 
classes de diviseurs des entiers cyclotomi- 
ques ; il se sert d’une fonction analogue à la 
fonction zêta (cf. fonction ZÊTA) : 

n(a) -’ = IX (1 - N(p) -' ) -' 

p 

(où A parcourt l’ensemble des diviseurs et 
P celui des diviseurs premiers) et de son 
comportement pour s — ► 1, et obtient 
h — /q/q, où le facteur h 2 , le plus difficile 
à calculer, a la signification ci-dessus ; le 
facteur /q est plus explicite : 

h = P 
1 (2X)“-' ’ 

avec P = cp(P)<p(p 3 )cp(p 5 ) ... (f(p A 2 ) |, 

(3 racine primitive (A — l)-ième de 1, et cp 
polynôme défini par (p(x) = 1 + Yj-Y 

+ y 2 x 2 + + Yx 2** 2 ’ où y est une 

racine primitive modulo A et, pour chaque 
y, y y est le reste de la division de y 7 P ar X. 
Kummer a calculé /q pour tous les 

\ < 100 ; la première valeur de A donnant 
£ 1 est 23, pour lequel /q = 3. La crois- 
sance de /q est très rapide : il vaut 
411 322 823 001 pour A = 97 et est équi- 
valent à à m/2+i / 2 m-, 7 T m pour X — ► x ; les 
nombres premiers irréguliers sont ceux 
pour lesquels h est divisible par X, et cela 
équivaut à dire que /q est divisible par À 
(Kummer a donné un critère simple à véri- 
fier pour cette propriété, au moyen des 

nombres de Bernoulli). 


4 Corps de nombres algébriques 

Dedekind (1871, 1893) a étendu les théo- 
ries précédentes en développant les notions 
de corps de nombres algébriques et 
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d’entiers algébriques. Un corps de nombres 
algébriques est une extension finie du corps 
Q des nombres rationnels ; un tel corps 
peut s’écrire K = Q(e), où 0 vérifie une 
équation algébrique irréductible f (x) — 0, 
de degré n , à coefficients rationnels (cf. 
corps) , et chacune des tl racines complexes 
de f définit un plongement de K dans le 
corps C des nombres complexes. On note /q 
le nombre des racines réelles, qui donnent 
des plongements de K dans R, et 2 r 2 le 
nombre de racines complexes (paires de 
racines complexes conjuguées) ; en tant 
qu’espace vectoriel sur Q, K est de dimen- 
sion n , avec 1, 0, 0 2 , . . . . 0 #l 1 comme base 
(division euclidienne ; cf. POLYNÔMES). Si 
g(8) G K, on appelle conjugués de g(0) les 
n nombres complexes g(0[),^(0 2 ), ...,^(0„), 
où 0j, 0 2 , . . . . 0„ sont les racines de/(x) = 0 ; 
ce sont tous des nombres algébriques. 

Entiers algébriques 

Parmi les nombres algébriques, les entiers 
algébriques sont définis de manière à 
former un anneau dont l’intersection avec 
Q soit réduite à Z ; on veut de plus que tous 
les conjugués d’un entier algébrique (c’est- 
à-dire les racines de son équation minimale 
à coefficients rationnels) soient encore 
entiers. Alors les coefficients de l’équation 
minimale d’un entier algébrique sont des 
entiers algébriques rationnels, c’est-à-dire 
des éléments de Z ; on définit donc les 
entiers algébriques comme les racines 
d’équations à coefficients entiers ration- 
nels, avec un coefficient dominant 1 (cf. 
anneaux commutatifs) , et il est facile de 
voir que l’équation minimale d’un tel 
nombre a encore ses coefficients entiers 
(donc les entiers algébriques rationnels 
sont bien les éléments de Z, ce qui 
généralise le résultat de Théétète cité au 
début). Pour étudier les entiers du corps 
K = Q(e), on peut supposer que 0 est 


lui-même entier ; si p = Cq + cq 0 + , M 
+ C n J0" -1 est entier, avec q £ Q, on a, 
pour tous ses conjugués p y — c 0 -j- 
tq0y + -f* 6’,j_i0J -1 . Les coefficients c, 
sont donc donnés par un système 
d’équations linéaires de matrice (0-) 
(0 ^ i ^ lî — 1 ; 1 j ^ n) ; le détermi- 
nant de cette matrice est : 

[J (0,-0*) = A# 0, 

;<k 

et on peut résoudre le système par les 
formules de Cramer qui montrent que 
l’entier rationnel A 2 est un dénominateur 
commun à tous les c,. Ainsi l’anneau o K des 
entiers de K est contenu dans le Z-module 
libre de base ( 07 A 2 ), et il est d’indice fini 
car il contient les 0 ; ; par suite, il est 
lui-même libre et a une base à n éléments 
(Wp Cl> 2, . . . . G) n ). La matrice de passage 
d’une base à une autre appartient à 
GL (n, Z) , et son déterminant vaut± 1 ; il 
en résulte que le déterminant de la matrice 
(<*/°), où on note (ù} ] \ (i)/ 2 \ .... co / (w) les 
conjugués de est défini au signe près par 
K. Le carré de ce déterminant est un entier 
rationnel d 0, que l’on appelle le discri- 
minant de K ; on a : 



et il n’y a qu’un nombre fini de corps de 
discriminant donné (Hermite). 

Par exemple, dans le corps Q(i) (avec r 
= — 1 ), les entiers sont de la forme m + ni 
avec m, n rationnels tels que riî + ni 
+ m — ni = 2 m et (m -f- ni)(m — ni) 
= m 2 + n 2 soient entiers ; alors 4 m 2 + 
4 n’est un entier, donc aussi 4 n 2 , et 2 n est 
encore entier. Enfin, la condition que 
(2 m) 2 -f- (2 n) 2 ™ 4 ( m 2 + n 2 ) soit divisi- 
ble par 4 exige que 2 m et 2 n soient pairs, 
donc ftî et n sont entiers ; les entiers de Q(i) 
forment donc l’anneau des entiers de Gauss 
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Zjy], de base (1, i). Le discriminant de Q(i) 
est le carré du déterminant de la ma- 
trice : 



soit (- 2 i) 2 = 4. Pour le corps Q(y) (avec 

j 2 +j + 1 = 0). les entiers sont m + nj, 
avec m -h nj + m + nj 2 = 2 ni n et 
(m + nj)(m + nj 2 ) = nr nw -b n 2 
entiers, et on voit encore que cela exige ni et 
U entiers ; l’anneau des entiers est Z [/], de 
base (1, j), et le discriminant est (y 2 — j) 2 
= 3. Passons au cas du corps cyclotomi- 

que Q(a), avec a Â * + a* -2 + 
+ a -j- 1 = 0, A étant un nombre premier 
impair (on vient de traiter le cas A = 3) ; si 
p = c 0 + c x a + + c x _ 2 a x ' 2 est un entier 
de ce corps, on a : 

(1 — a)p = c 0 (l — a) + Cj(a — a 2 ) + 

. . + c x _ 2 (cp— 2 — cri- 1 ), 

et on voit que la somme des conjugués, ou 
trace, de ce nombre vaut c 0 À, car la trace de 
0^ est — 1 pour 1 ^ j À — 1. Comme 
tous les conjugués (1 — a 7 )p ; du premier 
membre sont divisibles par 1 a, la trace 
C 0 À l’est aussi ; or c’est un entier rationnel : 
il est donc divisible par A et c 0 est entier. On 
peut recommencer ce raisonnement avec 
0t -1 (p — f 0 ), qui est encore entier, et mon- 
trer que C\ est entier ; en continuant, on voit 
que tous les c, sont entiers, et que l’anneau 
des entiers de Q(a) est Z[a], avec comme 
base (1, a , a x 2 ). Le discriminant est le 
carré du déterminant de la matrice (cri) 
(1 ^ ^ A — 1 ; 0 ^ j ^ X — 2), soit : 

(n 

j<i / 

= (— l)(»-iX«-2)/2 JJ — 

= (- 1)(2 l)/2 N(T(a», 


en désignant par f le polynôme : 

/(*) = x 1 -' + ... + x + 1 = ; 

on a (x- iy(;t) =V 1 — 1, donc 
/(jc) + ( x - 1 )/'(*) = XV- 1 , (a- 1) 

f(a) = Xa x et : 

XN(T(a)) = N(a — l)N(/"(a)) 

= A*— 1 (Na/- 1 = AA -1 

d’où, en définitive N(/'(0()) = X x ' 2 et d 

= (- l)< A -»/ 2 V- 2 . 

A côté de la trace 

Tr / (6) =/ (©i) +/ (0 2 ) + + / (9„) 

d’un élément f (6) de K, on définit sa 
norme Nf (9) =/(0,)/ (0 2 ) / (O,) ; la 
trace et la norme sont des nombres ration- 
nels, et ils sont entiers si f (0) est entier. Les 
unités de K sont les entiers de K de 
norme 1 ; elles forment un groupe multi- 
plicatif pour lequel le théorème de Diri- 
chlet est applicable en toute généralité. 

La théorie des idéaux 

Dedekind a remplacé la considération des 
« nombres idéaux », que Kummer n’avait 
jamais définis comme objets mathémati- 
ques, par celle d’objets véritables, qu’il a 
appelés les idéaux du corps K. L’idée est 
de considérer, au lieu d’un diviseur A et 
de la congruence f (0) = g(0) (mod A) 
qu’il définit dans les entiers algébriques, 
l’ensemble a de ces entiers qui sont 
congrus à 0 modulo A, c’est-à-dire 
l’ensemble des entiers algébriques divisi- 
bles par A ; Dedekind a pu caractériser les 
ensembles a d’entiers algébriques ainsi 
obtenus par les propriétés suivantes : si 
f (0) et g(B) appartiennent à a, il en est de 
même de f (0) + g(B) ; de plus, si f (0) G a 
et /i(0) G 0 K , alors /(0)/j(0) G a. Autre- 
ment dit a est un idéal de l’anneau û K des 

entiers de K (cf. ANNEAUX ET ALGEBRES) ; 

en tant que sous-groupe additif de û K , il est 
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donc libre de rang ^ n. Tout entier p G o K 
définit un idéal principal (p), ensemble des 
p (J, où a parcourt 0 K ; si a est un idéal 
quelconque, dire que a divise p, c’est-à-dire 
que p G a, revient donc à dire que (p) est 
contenu dans a. Le plus petit idéal conte- 
nant des entiers algébriques Pj, p 2 , . . . . p r 
joue le rôle de leur P.G.C.D., et on le note 
(p h p 2 , . . . . p,) ; c’est l’ensemble des com- 
binaisons pjGj -f- P2O2 + • + Pr°n °Ù 
üj, O 2 , • • • • O r parcourent o K . Tout idéal a 
peut s’écrire sous la forme (oq, a 2 , . . . . a,) 
en prenant, par exemple, pour 
a b a 2 , • • • • a, les éléments d’une base de a ; 
autrement dit, l’anneau «K est nœthérien 
(Cf. ANNE AUXC OMMUT AT IFS ) . Leproduitde 

deux idéaux a = (a„ .... a,) et b = 

(Pi, P* ••• • P f ) est l’idéal engendré par les 
produits d’un élément de a et d’un élément 
de b, c’est-à-dire ab = (oqPy) (1 ^ ^ r, 

1 < 7 ^ s) ; on dit que l’idéal a divise un 
idéal i s’il existe un idéal b tel que ab = i, 
et on écrit alors a i. Un idéal premier p est 
un idéal différent de (1) = 0 K et qui n’est 
pas divisible par un autre idéal que (1) et p. 

Le fondement de la théorie de Dede- 
kind est le fait que, pour tout idéal fl, il 
existe un idéal b ^ (0) tel que ab soit 

principal. On peut construire b en asso- 

ciant, à un système de générateurs 
oq, CU , a,, de a, le polynôme 

g(x) = cqx + a 2* 2 + «X et ses conju- 
gués g,(x) = oq (,) x H — h a r (, V ; le pro- 
duit F = g\g 2 . . . g r de ces conjugués est un 
polynôme à coefficients entiers rationnels 
et il est divisible par g : F = gh, avec 

h{x) = P,x + (k* 2 + + P.* x ' poly- 

nôme à coefficients entiers algébriques. On 
pose b = (Pj, P2, • • • • PO et on montre que 
ab est l’idéal principal engendré par le 
P.G.C.D. des coefficients de F en utilisant 
une extension du lemme de Gauss aux 
polynômes à coefficients dans 0 K : si un 
entier algébrique divise tous les coefficients 


d’un produit de deux polynômes g et h h 
coefficients dans o K , il divise tous les 
produits d’un coefficient de g par un 
coefficient de h. On peut alors prouver que 
l’égalité ab = ai avec a (0) (a, b, i idéaux) 
implique b = i ; en effet, en multipliant les 
deux membres de la première égalité par 
un idéal convenable on se ramène au cas 
où a est principal, qui est immédiat. Une 
autre propriété, qui revient essentiellement 
à dire que 0 K est ce que l’on appelle 
maintenant un anneau de Dedekind (cf. 
anneaux commutatifs) , est la suivante : 
pour qu’un idéal a divise un idéal i, il faut 
et il suffit que i soit contenu dans a ; la 
condition est évidemment nécessaire, et 
elle est aussi suffisante, car i C a implique 
ib C ab pour tout idéal b, ce qui permet de 
se ramener au cas facile où a est principal. 
Ainsi l’idéal a + b engendré par deux 
idéaux a et b est aussi le plus grand idéal 
qui divise à la fois a et b (supposés non tous 
les deux nuis) ; en utilisant ce 
P.G.C.D. comme dans l’arithmétique élé- 
mentaire, on montre que si un idéal 
premier p divise un produit d’idéaux, il 
divise l’un des facteurs, et on en déduit que 
tout idéal non nul et distinct de (1) s’écrit, 
d’une manière unique, comme produit 
d’idéaux premiers. 

Pour tout idéal non nul a, l’anneau 
quotient o K /a est fini ; en effet, si ex est un 
élément non nul de a, (N(a)) C (a) C fl, 
donc û K /a est un quotient de 0 K /(N(a)), qui 
est visiblement fini. La norme de a est. par 
définition, le nombre Na d’éléments de 
0 K /a ; lorsque a (a) est principal. N est 
la valeur absolue de N(a). Le théorème 
chinois signifie que la norme est multipli- 
cative : N(ab) = Na ■ Nb. Si p est un idéal 
premier, il divise au moins un entier 
rationnel (la norme d’un de ses éléments), 
donc, si p ^z£= (0), il divise un nombre 
premier rationnel p ; alors Np divise 
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N p = p } \ et on a donc Np = p / oùfest un 
entier ^ «, que l’on appelle le de p. 

L’anneau fini o K /p est intègre, donc c’est un 
corps à pt éléments. Pour tout a G o K , 
a Np = a (mod p) et. si a p = a (mod p), a 
est congru modlllo p à un entier rationnel. 
Dans le cas où le corps K = 0(0) est 
galoisien sur Q, c’est-a-dire que le poly- 
nôme minimal f(x) de 0 se décompose sur 
K en facteurs du premier degré, les n 
plongements de K dans C ont la même 
image, que l’on peut identifier à K, et un 
idéal a de K donne n images a 2 , . . . . a„ qui 
sont les conjugués de a ; le produit 
3j a 2 a„ est l’idéal principal de K engen- 
dré par Na. En particulier, la norme $ d’un 
idéal premier p est le produit des idéaux 
conjugués de p ; les idéaux premiers divi- 
sant p sont donc conjugués de p, et si aucun 
d’eux ne divisep avec une multiplicité ^ 2, 
J’ divise n et il y a «//conjugués distincts de 
p, chacun répété f fois. 

Considérons par exemple un corps qua- 
dratique Q(VD), où D est un entier ration- 
nel sans facteur carré ; dans ce cas, 
0 = VU est racine de f(x) - X 2 — 
D = 0, dont les racines complexes sont 
± VU. Le corps est galoisien, et les conju- 
gués de X + yVU sont les nombres 
.Y ± yV D ; la trace et la norme sont res- 
pectivement 2 .y et x 2 >’ 2 D, et les entiers 
du corps sont caractérisés par le fait que ces 
deux nombres rationnels sont entiers. En 
raisonnant comme plus haut, on voit que 
cela signifie que x et y sont entiers si D — 2 
OU 3 (mod 4) ; mais, si D = 1 (mod 4). cela 
signifie que .y = u/2 et y = y/2, où u et y 
sont des entiers de même parité. Dans le 
premier cas, une base des entiers est 
( 1. VU), et le discriminant vaut 4 D, tandis 
que dans le second cas une base des entiers 
est (I, (1 + VT))/2) et le discriminant est 
D. Soit p un nombre premier rationnel qui 
ne divise pas le discriminant ^ ; si p se 


décompose dans K, on a (p) = pp' où p et 
p’ sont des idéaux premiers de degré 1 
conjugués l’un de l’autre, et tout entier de 
K est congru modulo p à un entier ration- 
nel ; on en déduit que D est congru modulo 
p (resp. modulo 4 p) à un carré, c’est-à-dire 
que le discriminant d est un carré modulo 
4 p, donc aussi modulo 4 p. Inversement, si 
d = x 2 (mod 4 p) y le nombre (x + Vd)/ 2 
est un entier de K (sa trace est x et sa norme 
un multiple entier de p) qui n’est pas 
divisible par p (sinon son conjugué 
(x Vd)j 2 le serait aussi, donc aussi Vd, 
et d serait divisible par p 2 ) ; comme p 
divise : 

x + Vd x — Vd 

2 2 

sans diviser aucun facteur, il n’est pas 
premier dans o K , et il se décompose. Si 
maintenant y est un facteur premier impair 
de d , on vérifie que (q) est le carré de l’idéal 
premier q — ( q , (d -j- Vd)/2), qui est égal 
à son conjugué. Si enfin d est pair, on a 
2 = ( 2 , VU) 2 si D = 2 (mod 4) et 2 = (2, 

1 -|- VU) 2 si D = 3 (mod 4). Comme d est 
toujours congru à 0 ou à 1 modulo 4, son 
caractère quadratique modulo 4 p est le 
même que modulo p si p 2 ; les nombres 
premiers rationnels se rangent donc en 
trois catégories : 

1. Ceux qui ne divisent pas d et modulo 
lesquels d est un carré, qui se décomposent 
en produit de deux idéaux premiers dis- 
tincts conjugués. 

2. Ceux qui ne divisent pas d et modulo 
lesquels d n’est pas un carré, qui restent 
premiers dans K. 

3. Ceux qui divisent d , qui sont des 
carrés d’idéaux premiers égaux à leur 
conjugué. (Pour p = 2, on teste le carac- 
tère de d mod 8.) 

Cela généralise ce qu’on avait observé 
pour Q(i), Dedekind a démontré un résul- 
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tat plus général, qui englobe aussi les 
résultats de Kummer sur la décomposition 
des nombres premiers rationnels dans les 
corps cyclotomiques : si K = 0 ( 0 ) est un 
corps de nombres algébriques engendré 
par un entier algébrique 0 d’équation 
minimale / ( 0 ) = 0 et si p est un nombre 
premier qui ne divise pas l’indice 
C(0) = ( 0 K : Z[ 0 ]), à une décomposition 
modulo p : 

/(*) = J| (P /(•* )) e ‘ (mod p) 

1 

de /(.V) en produit de polynômes irréduc- 
tibles P, (distincts modulo p) correspond 
une décomposition : 

r 

=n^ 

i — 1 

en produit d’idéaux premiers P; distincts, 
les multiplicités e , étant les mêmes. Pour 
chaque /, on dit que e t est l’indice de 

ramification de p j et, en considérant la 
norme N p = p n de p , on voit que : 

*" 2 > 

où les f sont les degrés des p,-. Malheureu- 
sement, il y a des cas où on ne peut pas 
obtenir la décomposition de p par le 
résultat précédent (lorsque p divise C(0) 

quel que soit le choix de 0 ). Les idéaux 
premiers ramifiés p, c’est-à-dire ceux qui 
divisent un nombre premier rationnel p 
avec un indice de ramification e ^ 2 , sont 
les diviseurs d’un idéal bien déterminé, 
dont la norme est d | ; on appelle la 
différente de K. 

idéaux fractionnaires ; classes d’idéaux 

On appelle idéal fractionnaire de K un 
sous-o, -module non nul a de K tel qu’il 

existe un entier non nul 5 vérifiant 


Ôa C 0 K ; alors a est engendré, comme 
0 K -module, par un nombre fini d’éléments 
de K. Les idéaux fractionnaires forment un 
groupe pour la multiplication, avec 
(1) = o K comme élément unité ; c’est un 
groupe commutatif libre avec comme base 
l’ensemble des idéaux premiers. 

Dedekind définit l’équivalence des 
idéaux a et b par l’existence d’un même 
idéal i 7^ (0) tel que ai et bi soient tous deux 
principaux ; il revient au même de dire que 
l’idéal fractionnaire quotient ab 1 est prin- 
cipal. Autrement dit, le groupe des classes 
d’idéaux est le groupe quotient du groupe 
des idéaux fractionnaires par le SOUS- 
groupe des idéaux fractionnaires princi- 
paux (c’est-à-dire engendrés par un seul 
élément). Par une méthode analogue à 
celle de Kummer, Dedekind montre, dans 
le cas général, que le groupe des classes 
d’idéaux est fini ; en utilisant la fonction : 

C K 0) = ^ (Na)-* 

et son comportement pour s — ► 1, il établit 
un lien remarquable entre le nombre h des 
classes d’idéaux et la « densité » des 
idéaux. 

Par ailleurs, Dedekind a montré que la 
classification des formes quadratiques 
binaires développée par Gauss était essen- 
tiellement équivalente à celle des idéaux du 
corps quadratique de même discriminant ; 
la loi de groupe définie par Gauss au 
moyen de la composition des formes sur 
l’ensemble des classes de formes quadra- 
tiques de discriminant donné correspond à 
celle du groupe des classes d’idéaux. 

5. Corps de classes 

La difficile théorie du corps de classes tire 
son origine de plusieurs résultats établis au 
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cours du xix’ siècle. Nous avons vu que 
Gauss avait associé, à tout nombre pre- 
mier impair p , une somme : 

corps des racines p-ièmes de 1 , dont le 
carré est (— \) [ P ])i2 p ; le sous-corps de 
Q(y) engendré par la somme de Gauss est 
donc isomorphe au corps quadratique 
Q(V(- \Y p ~ {)ll pY Kronecker a obtenu 
une vaste généralisation de ce résultat (la 
démonstration complète est due à Weber) : 
tout corps K de nombres algébriques dont 
le groupe de Galois sur Q est commutatif 
se plonge dans un corps cyclotomique. La 
théorie de la multiplication complexe des 
fonctions elliptiques a ensuite conduit 
Kronecker à formuler une conjecture ana- 
logue pour les corps de nombres algébri- 
ques K contenant un corps quadratique 
imaginaire k et tel que le groupe de Galois 
G(K/A') soit commutatif (« rêve de jeu- 
nesse de Kronecker », 1857) ; dans cette 
conjecture, qui n’a été complètement 
démontrée qu’en 1920, les fonctions ellip- 
tiques admettant de la multiplication com- 
plexe par certains entiers de k jouent le rôle 
que jouait l’exponentielle imaginaire pour 
les racines de 1. 

En étendant la théorie de Kummer aux 
corps cyclotomiques Q(o) = K, où a est 
une racine m-ième de 1, m entier quelcon- 
que. on constate que la décomposition 
d’un nombre premier rationnel p qui ne 
divise pas nui (ci discriminant de K) ne 
dépend que de l’ordre f de p modulo m ' 
p se décompose en C> = cp facteurs 
premiers idéaux distincts de degré f dans 
K, où cp (m) est l’indicateur d’Euler (cf. 
divisibilité) . En particulier, si p = 1 

(mod m), c’est le produit de cp (m) idéaux 
premiers de degré 1 ; au moyen de la 
fonction Ç K , on peut montrer que l’ensem- 


ble des idéaux premiers de degré 1 de K est 
infini, et il en résulte qu’il y a une infinité 
de nombres premiers dans la progression 
arithmétique de raison }}} qui contient 1 (cf. 
la partie A ci-dessus - Théorie analytique 
des nombres). Weber a essayé de généra- 
liser ce genre de considérations en rem- 
plaçant Q par un corps de nombres 
algébriques k et m par un idéal m ; il 
considère le groupe A,„ des idéaux frac- 
tionnaires de k premiers à III et un SOUS- 
groupe H m d’indice fini h ' formé d’idéaux 
principaux dans A,„. Il fait alors les hypo- 
thèses suivantes : 

ü) Les idéaux entiers de k sont « éga- 
lement distribués » dans les classes de 
A m /H in (comme ils le sont dans les classes 
d’idéaux habituelles). 

b) Il existe une extension K de A de 
degré ^ fï telle que les idéaux premiers 
de H in de degré 1 se décomposent com- 
plètement dans K (c’est-à-dire en pro- 
duit d’idéaux distincts tous de degré 1); 
l’extension K s’appelle un corps de classes 
pour k. 

Weber montre alors que chaque classe 
de A m /H m contient une infinité d’idéaux du 
premier degré. Dans le cas où k = Q, on 
peut prendre pour H,„ le groupe des idéaux 
engendré par un nombre congru à 1 
modulo mi ; dans ce cas, Weber a aussi 
établi que le groupe de Galois de 
Q(t J = K sur Q s’identifie à A m /H„, (t m 
racine wz-ième de 1). et qu’a chaque 
sous-groupe H’,„ D H U1 correspond un 
corps de classes K’ C Q(C,„) de groupe de 
Galois A m /H m . Dans le cas général, en 
supposant l’existence du corps de classes 
K, Weber a seulement démontré que son 
degré sur k est égal a //'et qu’il est galoisien 
sur k. Revenant au cas particulier k = Q. 
si L est une extension abélienne quelcon- 
que de Q, elle SC plonge dans un corps 
Q(t,„) (théorème de Kronecker- Weber) et 
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correspond donc à un groupe d’idéaux 
principaux H’„, tel que H m C H’„ C A,„ et 
que Gal(L/Q) ~ A w /H',„ ; l’entier m n’est 
pas unique, mais il admet une valeur 
minimale dont toutes les autres sont des 
multiples (le conducteur de L). Weber a 
encore formulé des conjectures qui éten- 
dent ces énoncés au cas où Q est remplacé 
par un corps de nombres algébriques k. 

Hilbert a abordé la théorie du corps de 
classes d’un autre point de vue, à partir de 
la théorie des formes quadratiques, et il est 
parvenu à construire certains corps de 
classes, correspondant au groupe de clas- 
ses d’idéaux A/H+, où A est le groupe des 
idéaux fractionnaires d’un corps de nom- 
bres algébriques k et H 4. le groupe des 
idéaux principaux engendré par des entiers 
de k qui sont positifs dans tous les plon- 
gements réels de k. Le corps de classes de 
Hilbert est unique, et son groupe de Galois 
sur k est A/H+ ; dans ce corps, tous les 
idéaux de 0 ^ deviennent principaux. 

Frobenius (1896) a introduit un objet 
important dans la théorie du corps de 
classes : l’automorphisme de Frobenius, 
ainsi construit. On considère une extension 
galoisienne finie K de Q et un idéal 
premier p de K, divisant un nombre 
premier rationnel p et non ramifié ; alors le 
sous-groupe Z(p) du groupe de Galois 
Gai (K/Q) formé des automorphismes de 
K qui laissent p invariant (« groupe de 
décomposition ») s’identifie au groupe de 
Galois du corps résiduel û K /p sur Z/(p). A 
l’élévation à la puissancep-ième, qui est un 
automorphisme de 0 K /p, correspond donc 
un élément ((K/Q)/p) de Z(p), qui est par 
définition l’automorphisme de Frobenius ; 
pour ci G Gai (K/Q) quelconque, ((K/Q)/ 
(op)) est conjugué de ((K/Q)/p) SOUS 
l’action de (y. Comme les idéaux premiers 
de K qui divisentp sont tous conjugués, les 
automorphismes de Frobenius qui leur 


correspondent appartiennent à une même 
classe de conjugaison dans Gai (K/Q), et 
en particulier ils sont égaux si ce dernier 
groupe est commutatif. Cebotarëv (1925) 
a pu montrer que, pour toute classe de 
conjugaison à m éléments dans Gai (K/Q), 
la densité des nombres premiers p qui 
donnent des automorphismes de Fro- 
benius appartenant à cette classe est m/n , 
où ri = (K : Q) est le degré de K. La loi 
de réciprocité d’Artin (1927 ; la formula- 
tion d’Artin vaut en fait pour un corps de 
base k général, et pas seulement pour Q) 
signifie que, pour une extension abélienne 
L de Q, l’automorphisme de Frobenius 
((L/Q)/P> correspondant à un nombre 
premier p est l’identité exactement dans 
le cas où p appartient au sous-groupe 
H’,, correspondant (où m est le conducteur 
de L). 

6. Idèles et adèles 

Dans ses recherches sur les formes qua- 
dratiques à coefficients dans un corps de 
nombres algébriques k, en vue d’étendre 
un résultat de Minkowski, Hilbert avait été 
conduit à considérer simultanément des 
congruences modulo les puissances des 
idéaux premiers du corps, et les équations 
correspondantes dans R ou dans C, pro- 
venant des divers plongements de k ; il 
appelait place de k un idéal premier de k, 
ou bien un plongement de k dans R ou 
dans C, ces dernières places étant quali- 
fiées de « places à l’infini ». Takagi ( 1920 ), 
dans ses démonstrations des conjectures 
de Weber en théorie du corps de classes, 
a modifié la notion de diviseur telle que 
nous l’avons introduite plus haut, de 
manière à inclure les places à l’infini : selon 
Takagi, un diviseur est un symbole 
m = pj"i p 2 "2 . p, w r, avec n,G N, les p. 
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étant des places finies (= idéaux premiers) 
ou non. Dans les diviseurs fractionnaires, 
on admet des exposants rij négatifs, et on 
a ainsi un groupe multiplicatif; à un 
diviseur entier m, on associe le groupe A,„ 
des diviseurs fractionnaires premiers à m, 
et le sous-groupe Hm des diviseurs princi- 
paux congrus à 1 modulo m, c’est-à-dire 
congrus à 1 modulo p/à pour tout i tel que 
P; soit un idéal premier, et d’image positive 
pour toute place à l’infini réelle p,. Les 
groupes de classes d’idéaux de Weber sont 
alors remplacés par les groupes de classes 
de diviseurs A m /H m et leurs quotients de la 
forme A„,/H m • N K/ *(A ra (K)), où K est une 
extension galoisienne finie de k, A,„(K) est 
le groupe des diviseurs fractionnaires de K 
premiers à Ut, et est la « norme 

relative » ; si l’ordre du groupe quotient 
précédent est égal au degré (K : k), K est 
un corps de classes au sens de Takagi, et 
son groupe de Galois sur k est isomorphe 
à ce quotient. Toute extension abélienne de 
k est un corps de classes pour un certain 
diviseur m, que l’on peut choisir minimal 
(le « conducteur » de K). 

Une théorie analogue, mais beaucoup 
plus simple, a été développée par Hasse 
( 1929 - 1930 ), en considérant, au lieu du 
corps de nombres algébriques k son com- 
plété k 9 pour la valuation associée a l’idéal 
premier p ; ce corps k 9 est une extension 
finie du corps p-adique Q p , où p est le 
nombre premier que p divise (cf. la partie 
B ci-dessus - Nombresp-adiques), et il a des 
propriétés analogues : son anneau 0 p des 
entiers, éléments de valuation ^ 0, est 
principal et il a un seul idéal premier non 
nul, engendré par p. La théorie du corps de 
classes local de Hasse établit une corres- 
pondance bijective entre les sous-groupes 
d’fiwfiœ fini H du groupe multiplicatif de 
k 9 et les extensions abéliennes finies K p de 
k v (ce sont aussi des corps locaux, exten- 


sions finies de Q^, et on note Jî l’unique 
idéal premier non nul) ; pour une telle 
extension, H est l’image du groupe multi- 
plicatif de K p par la norme relative N K ^ . 
Les démonstrations de Hasse étaient fon- 
dées sur la théorie « globale » de Takagi, 
mais Che valley (1933) est parvenu à un 
exposé autonome de la théorie locale. Il eut 
ensuite l’idée de récupérer la théorie glo- 
bale a partir de la théorie locale ( 1936 - 
1940), en remplaçant les diviseurs de 
Takagi par les idèles. Un idèle de k est un 
élément (Ç p ) p du produit des groupes mul- 
tiplicatifs de tous les complétés /c p de k , p 
variant dans l’ensemble de toutes les pla- 
ces, y compris les places à l’infini ; pour 
ces dernières, le complété est R si la place 
est réelle, et C si la place est imagi- 
naire (d’après un théorème d’Ostrowski 
( 1935 ), toutes les valeurs absolues possi- 
bles sur k sont équivalentes à l’une de 
celles qui sont définies par les places ; 
cf. algèbre topologique) . On impose, de 
plus, que V p (Cp) = 0 sauf pour un nombre 
fini de places finies p, en notant v p la 
valuation correspondante ; l’ensemble I(k) 
des idèles de k est un sous-groupe du 
produit : 

IL; 

p 

des groupes multiplicatifs. Le groupe mul- 
tiplicatif k* de k se plonge dans I(k), 
chaque t, G k donnant pour image l’ idèle 
(£ p ) tel que ç p = £ pour toute place p ; on 
a un homomorphisme de I(k) sur le groupe 
des idéaux fractionnaires de k, qui trans- 
forme l’ idèle (ç p ) en l’idéal : 

p 

(prouàYÜ éiCiîuCi n aàA' r pikueîr finies). Le 
noyau de cet homomorphisme est l’ensem- 
ble U(k) des idèles (q p ) tels que ç p soit 
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une unité de k p (élément de valuation 0) 
pour toute place finie p ; il en résulte que 
le groupe des classes d’idéaux est iso- 
morphe au quotient l(k)/k*U(k). Lorsque 
K est une extension abélienne finie de k, 
Chevalley définit un homomorphisme 
de norme N : I(K) — ► I(k) en combinant 
les normes relatives locales ; à tout idèle a, 
il associe un symbole (a, K/fc) E Gai (K/ 
k), égal au symbole d’Artin : 

(V). 

où a est l’idéal associé à un idèle a E k* a 
et congru à 1 modulo le conducteur de K. 
La loi de réciprocité d’Artin signifie que les 
idèles a tels que (a, YLjk) soit l’identité sont 
les éléments de k * . N k ^(I(K)), de sorte 
que Gai (K//c) est isomorphe à I(k)/ 

r . n k/ ,(kk)). 

La théorie multiplicative des idèles doit 
être complétée par une théorie additive, 
celle des adèles , introduits par A. Weil : un 
adèle de k est un élément (£ p ) p du produit : 

IL" 

p 

tel que v p (Ç p ) ^ 0 sauf pour un nombre fini 
de places finies p. L’ensemble A(k) des 
adèles est un sous-anneau du produit : 

EL"' 

p 

dont I(k) est le groupe multiplicatif des 
éléments inversibles ; on plonge le corps k 
dans A(k) comme k x dans I(k). En plus de 
ces structures algébriques, A(k) a une 
topologie localement compacte, compati- 
ble avec sa structure d’anneau, et qui 
provient du fait que chaque o p est un 
anneau compact, donc le produit : 

EL- 


est aussi compact (théorème de Tycho- 
noff ; cf. TOPOLOGIE GÉNÉRALE) ; pour Obte- 
nir A(k), on remplace un nombre fini de 
facteurs op par le corps localement com- 
pact k 9 et on ajoute un nombre fini de 
facteurs égaux à R ou à C. La topologie 
induite sur I(k) n’est pas compatible avec 
la structure de groupe, et on doit la 
remplacer par la topologie du graphe de 
l’application a i— ► aT x (a E E(k)), considéré 
comme sous-espace de A(k) X A(k). Les 
résultats essentiels concernant ces topolo- 
gies sont les suivants : l’image de k (resp. 
k*) dans A(k) (resp. I(k)) est discrète et le 
quotient A (k)/k (resp. \(k)/k*) est com- 
pact ; de ces résultats, on peut déduire sans 
peine la finitude du nombre de classes 
d’idéaux et le théorème des unités de 
Dirichlet. D’une manière plus générale, on 
peut associer, à tout groupe algébrique 
linéaire G (cf. gÉomÉtrie ALgÉbrique) 
défini sur le corps k, un groupe localement 
compact G a , adélisé de G, construit 
comme I(k) à partir du groupe multipli- 
catif ; Tamagawa et A. Weil ont montré 
que, dans le cas d’un groupe semi-simple, 
le groupe des points rationnels sur k de 
G se plonge dans G A comme sous-groupe 
discret et que l’espace homogène quotient 
G A IG(. est de volume fini pour une mesure 
semi-invariante. Le calcul de ce volume, 
par exemple pour le cas où G est le groupe 
orthogonal associé à une forme quadrati- 
que, est équivalent aux résultats de Siegel 
sur le nombre de représentations d’une 
forme quadratique à coefficients entiers 
par un genre donné de formes (cf. formes 
QUADRATIQUES) . 

CHRISTIAN HOUZEL 

Bibliographie 

Y. Amice, Les Nombres p-adiques , Presses univer- 
sitaires de France, Paris, 1975 / E. Artin & J. Tate. 


719 



NORMEES ALGÈBRES 


Class Field Theory , Benjamin, New York, 1968, 
rééd., Addison-Wesley, Redding (Mass.), 1990 / 
z. î. Borevic & I. r. Safarevic, Number Theory , 
Acad. Press, New York, 1966, reprod. en fac-sim., 
J. Gabay, Sceaux. 1993 / J. w. s. Cassels & 
m. j. txylor, Algebraic Number Theory , Cam- 
bridge Univ. Press, New York, 1992 / J. Dieudonné 
et ai., Abrégé d’histoire des mathématiques , Her- 
mann. Paris, nouv. éd., 1986 / h. m. Edwards, 
Fermais Last Theorem, Springer, New York, 1989 / 
D. Hilbert, Théorie des corps de nombres algébri- 
ques, J. Gabay, 1991 / K. Ireland & m. risen, A 
Classical Introduction to Modem Introduction to 
Modem Number Theory , ibid . , 1990 / S. Lang. 
Algebraic Number Theory , rééd., Springer, 1986 / 
P. Ribenboïm, T he Book of Prime Number R ecords, 
Springer, 1989 / P. Samuel, Théorie algébrique des 
n ombre. Hermann, 1967 / j.-p. Serre, Corps 
locaux , ibid . , 3' éd. 1980 / a. weil, Ztac Number 
Theory , Springer, Berlin, 1985. 


NOMBRES COMPLEXES 
— *• COMPLEXES NOMBRES 


NOMBRES 

TRANSCENDANTS 

— > TRANSCENDANTS nombres 


NORMÉES ALGÈBRES 


A U point de rencontre de deux types de 
structures, structures algébriques et 
structures topologiques, les algèbres nor- 
mées jouent un rôle important dans de 
nombreux domaines de i r, cma\yse mathé- 
matique. Développée à partir de 1940 
environ, essentiellement par des mathéma- 


ticiens soviétiques (I. M. Gelfand, M. A. 
Naimark, D. A. Raikov, G. E. Sylov), la 
théorie des algèbres normées avait primi- 
tivement pour objet de placer dans un 
cadre abstrait et général l’étude de certai- 
nes algèbres normées particulières (en 
l’occurrence, les algèbres de convolution 
de fonctions intégrables pour une mesure 
de Haar d’un groupe localement compact) 
en isolant leurs propriétés les plus mar- 
quantes et les plus caractéristiques. 

On reconnaît là le processus d’axioma- 
tisation, qui a été si souvent utilisé en 
mathématiques et qui est si riche de 
conséquences. 

Historiquement issue de l’analyse har- 
monique (dont l’un des principaux objets 
est précisément l’étude de l’algèbre de 
convolution des fonctions intégrables sur 
un groupe), la théorie des algèbres nor- 
mées permit par la suite d’obtenir de 
nouveaux résultats aussi bien en analvse 
harmonique que dans d’autres branches de 
l’analyse (cf. analyse HARMONIQUE). 

1. La notion d'algèbre normée 
Définition 

Une algèbre normée est un ensemble muni 
à la fois d’une structure d’espace vectoriel 
sur le corps des nombres complexes, d’une 
structure d’anneau et d’une norme (cf. 
espaces vectoriels normés ; anneaux et 

ALGÈBRES). 

Plus précisément, notons C le corps des 
nombres complexes. Un ensemble A est 
alors une algèbre normée si les conditions 
suivantes sont réunies : 

a) On définit sur A deux lois de compo- 
sition interne, addition et multiplication, 
qui munissent A d’une structure d’anneau ; 
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b) On définit une loi de composition 
externe, multiplication par les scalaires 
complexes, qui, jointe à la loi interne 
d’addition, munit A d’une structure 
d’espace vectoriel sur C ; 

c) Les structures d’anneau et d’espace 
vectoriel sont compatibles en ce sens que, 
quels que soient les éléments A de C et les 
éléments a et b de A, on a : 

\{ab)= ( Xa)b= a(\b ); 

d) On définit sur A une norme, c’est- 
à-dire une application x >— ► || x || de A dans 
l’ensemble des nombres réels positifs telle 
que, quels que soient les éléments \ de C 
et les éléments a, b et c de A, on ait : 

«<* Il = o, 

si et seulement si a = 0, élément neutre de 
l’addition dans A, 

I \a + b | < ||a I + 1 6 ||, 

l|Aa|| = |X||M, 

Il ab || < ||a || 1 A | ; 

e) La distance déduite de la norme (la 
distance de deux éléments a et b étant, par 
définition, ||a — t\\ ) munit A d’une struc- 
ture d’espace complet (cf. espaces METRI- 
QUES, chap. 3). 

Pour cette raison, les algèbres normées 
sont fréquemment appelées algèbres de 
Banach , par analogie avec les espaces 
vectoriels normés complets, dits espaces 
de Banach. 

Si la multiplication interne est commu- 
tative, on parle d’algèbre normée commu- 
tative. Si la multiplication interne possède 
une unité, on parle d’algèbre normée 
unitaire. 

Exemples 

Indiquons trois types fondamentaux 
d’ algèbres normées. 


(1) Soit X un espace topologique, et soit A 
l’ensemble des fonctions continues et bor- 
nées sur X, muni des opérations usuelles et 
de la norme : 

||a | = sup | a (x) | ; 

xGX 

c’est une algèbre normée commutative 
unitaire. 

(2) Soit E un espace de Banach et soit 
A = L(E) l’ensemble des applications 
linéaires continues de E dans lui-même. 
L’addition et la multiplication par les 
scalaires sont définies de manière usuelle ; 
la multiplication interne est la composition 
des opérateurs linéaires. Quant à la norme, 
elle est définie par : 

lia ||= sup II a (x) || E ; 

.ïSE 

U II E =L 

c’est la norme habituelle des opérateurs. A 
est ainsi muni d’une structure d’algèbre 
normée unitaire (l’unité de A est l’opéra- 
teur I E , identité de E dans E), non com- 
mutative si E est de dimension supérieure 

à 1. 

(3) G est un groupe localement compact 
et p est une mesure de Haar à gauche sur 
G (cf. analyse HARMONIQUE , chap. 4). 
Rappelons que c’est une mesure telle que 
l’on ait, pour toute fonction intégrablefet 
pour tout élément t de G, 

la fonction /, translatée de f à gauche par 
î étant définie par : 

,/(*)=/(*-<*). 

A est l’espace de Banach L 1 (ju) des 
fonctions p-intégrables, muni de sa 
norme : 

11/1 = 
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la multiplication interne est l’opération de 
convolution, notée « * », définie par : 

if*g)(x) = jf<y)g(y-'x)dn(y), 

formule ayant un sens « jj-presque- 
partout », 

On a ainsi défini une algèbre normée, 
commutative lorsque le groupe G est 
commutatif, unitaire lorsque le groupe G 
est muni de la topologie discrète, Cet 
exemple, auquel il a été fait allusion dans 
T introduction, est à l’origine de toute la 
théorie. 


2. Les algèbres normées 

commutatives 

Nous allons examiner quelques propriétés 
fondamentales des algèbres normées en 
présentant d’abord la théorie dans le cas 
des algèbres normées commutatives et 
unitaires. 

Idéaux maximaux et caractères 
L’étude des idéaux maximaux est sans 
doute l’outil le plus puissant pour obtenir 
des propriétés des algèbres normées com- 
mutatives unitaires, 

Indiquons brièvement qu’un idéal 
d’une algèbre normée commutative A est 
une partie 1 de A qui est un sous-espace 
vectoriel de A et qui, d’autre part, contient 
l’élément ab dès que a est un élément de 
I et b un élément quelconque de A. 
Évidemment A est un idéal (peu intéres- 
sant !) de 4. Un idéal est dit maximal s’il 
n’est contenu strictement dans aucun idéal 
autre que l’algèbre A elle-même. 

On appelle caractère de l’algèbre nor- 
mée commutative umitare A tout homo- 
morphisme non identiquement nul de A 
dans C : autrement dit, un caractère de A 


est une fonction % définie sur A, à valeurs 
complexes, non identiquement nulle, telle 
que, quels que soient A dans C, et a et b 
dans A, on ait : 

x(M) = *x(a). 

X(û + b)= y. (a) + x(b), x (ab) = x (a) x (*)■ 

Il est facile de vérifier que le noyau d’un 
caractère, c’est-à-dire l’ensemble des élé- 
ments de A où s’annule ce caractère, est un 
idéal maximal. En fait, caractères et idéaux 
maximaux satisfont aux propriétés suivan- 
tes : 

a) Tout idéal propre (c’est-à-dire distinct 
de A) est contenu dans au moins un idéal 
maximal ; 

b) Tout idéal maximal est fermé pour la 
topologie définie par la norme sur A ; 

c) Tout idéal maximal est le noyau d’un 
caractère bien déterminé, et tout caractère 
admet pour noyau un idéal maximal : cela 
établit une correspondance biunivoque 
entre les idéaux maximaux et les caractères. 

Les deux dernières propriétés entraînent 
le fait remarquable que, pour une algèbre 
normée commutative unitaire, tout carac- 
tère (défini uniquement par des propriétés 
algébriques) est automatiquement continu. 

Spectre et transformation de Gelfand 

L’ensemble des caractères de A est appelé 
spectre de A : nous noterons A(A) cet 
ensemble. 

À tout élément a de A on peut associer 
une fonction â, appelée transformée de 
Gelfand de a, définie sur A(A), à valeurs 
complexes : la valeur de â au point % de 
A(A) est simplement la valeur prise par le 
caractère % au point a de A : 

a(x) = *(<*)■ 

Il vsrAz m ) une topologie d’espace 
compact et une seule pour laquelle les fonc- 
tions a sont toutes continues ; on considère 
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toujours le spectre A(A) muni de cette 
topologie (topologie de Gelfand). 

La correspondance entre caractères et 
idéaux maximaux de A se matérialise alors 
de la manière suivante : l’idéal maximal 
associé au caractère x (le noyau de x) est 
l’ensemble des éléments a de A dont les 
transformées de Gelfand s’annulent au 
point x de A(A). 

Reprenons l’exemple (1) dans le cas où 
X est un espace compact ; il est assez facile 
de voir que les caractères de A sont définis 
par les points de X : au point X on associe 
le caractère X v tel que, pour la fonction 
continue boméefsur X, élément de A, on 
ait Xx(f) — /(x). On obtient ainsi tous les 
caractères, et cette correspondance donne 
un homéomorphisme entre X et A(A) qui 
permet d’identifier les éléments de A et 
leurs transformées de Gelfand. 

Pour l’exemple (3), dans le cas d’un 
groupe discret commutatif, le spectre de A 
s’identifie au groupe compact dual, et la 
transformation de Gelfand correspond 
alors à la transformation de Fourier (cf. 
analyse harmonique). 

L’ensemble des valeurs prises par la 
transformée de Gelfand a d’un élément a 
de l’algèbre normée commutative unitaire 
A est appelé le spectre de a (bien distinguer 
entre le spectre de l’algèbre et le spectre 
d’un élément de l’algèbre). Pour tout 
a G A, et tout X £ A(A), on a : 

|£(x)| = lx(fl)l ^ Il a ||. 

On appelle rayon spectral de a le nombre 
| a 1^, borne supérieure des a (x) |, P our X 
dans A(A). L’application qui à tout élément 
a associe son rayon spectral est une semi- 
norme (car elle peut s’annuler pour a 0) 
inférieure ou égale à la norme de A. On 
peut, à ce propos, énoncer le « théorème du 
rayon spectral » suivant. 


Théorème. Pour tout élément a de A. on 
a : 

llfllL = lim II a "II"". 

Les algèbnes semi-simples 

Si la transformation de Gelfand est injec- 
tive, c’est-à-dire si deux éléments distincts 
a et b de A ont des transformées a et b 
distinctes, on dit que l’algèbre normée 
considérée est semi-simple. Cela revient à 
dire que l’intersection des idéaux maxi- 
maux ne contient que l’élément 0. 

La transformation de Gelfand permet 
alors d’interpréter toute algèbre normée 
commutative unitaire semi- simple comme 
une sous-algèbre de l’algèbre des fonctions 
continues sur un espace compact, qui est 
le spectre de l’algèbre donnée. 

Les algèbres semi-simples jouissent de 
diverses propriétés spéciales : par exemple, 
soit A et B deux algèbres normées com- 
mutatives unitaires, B étant semi-simple ; si 
h est un homomorphisme algébrique de A 
dans B (c’est-à-dire une application telle 
qu’on ait : 

h (Au) = Ah (a), 

h (a + b) = h (a) + h(b), h ( ab ) = h (a) h (b) 

pour tout X dans C et tout choix de a et h 
dans A), alors h est automatiquement 

continu. Comme cas particulier, dans le 
cas où B est le corps C des nombres 
complexes, on retrouve la continuité des 

caractères. 

Le calcul fonctionnel holomorphe 

Soit A une algèbre normée commutative 
unitaire et a un élément de A; appelons 
o(u) le spectre de ensemble des nombres 
complexes qui sont les valeurs prises par a , 
transformée de Gelfand de a. 
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Sifest une fonction continue à valeurs 
complexes définie sur o(a), on peut consi- 
dérer la fonction composée f o a et se 
demander s’il existe un élément b dans 
l’algèbre tel que/o ü soit la transformée de 
Gelfand de b. 

Si l’algèbre A est semi-simple, il est clair 
qu’il peut exister au maximum un seul 
élément b de cette sorte. Si la fonction f est 
quelconque, il n’y a en général aucune 
raison pour qu’il existe un tel b ; mais si A 
est l’algèbre des fonctions continues sur un 
espace compact et si / est simplement 
supposée continue, ce sera le cas, 

Supposons maintenant quef’soit définie 
par une série entière : 

/(*) = ^ c„z", 
n - 0 

dont le rayon de convergence soit supé- 
rieur au rayon spectral de a. Alors la série : 



converge dans A vers un élément b , noté 
f(à), dont la transformée de Gelfand est 
précisément b = f o ci. Cela résulte de 
propriétés élémentaires. 

Moins simple est le théorème suivant, 
qui généralise de beaucoup les considéra- 
tions ci-dessus : 

Soit A une algèbre normée commutative 
unitaire semi- simple, a un élément de A et 
f une fonction analytique définie sur un 
voisinage du spectre de a. Il existe un élé- 
ment b de A, et un seul, tel que b = foa. 

Si, en particulier, f est un polynôme : 

N 

/( z > = y v. 

n = 0 

b est alors l’élément : 



Si 0 n’appartient pas au spectre de a, ce 
qui signifie que a est inversible, et si 
f(z) = 1 /z t alors b est l’inverse de a. 

Un cas historiquement important de ce 
cas particulier, dont la théorie des algèbres 
normées permet de donner une démons- 
tration simple et pénétrante, est le résultat 
suivant : 

Théorème de Wiener-Levy. Soit une 
fonctionfcontinue, par exemple de période 
2tt, et admettant pour série de Fourier : 

c n e int , 

où la série 

+ 00 

n =— œ 

est absolument convergente. Alors, si f ne 
s’annule jamais, la fonction inverse \jf 
possède une série de Fourier : 

où la série : 


+ CO 



est absolument convergente. 

Les algèbres normées commutatives 
non unitaires 

Il existe un procédé standard pour associer 
à toute algèbre normée A une algèbre 
normée unitaire A„ telle que A soit une 
sous-algèbre de A,. Ce procédé, assez 
élémentaire, permet en principe de rame- 
ner l’étude de problèmes concernant 4 à 
des problèmes qui portent sur A,. Cepen- 
dant, dans bien des cas, cette appïûche est 
insuffisante et il faut étudier directement 
les propriétés d’une algèbre non unitaire. 
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L’outil fondamental dans le cas com- 
mutatif unitaire, l’étude des idéaux maxi- 
maux, ne s’applique pas directement au cas 
non unitaire : il faut introduire la notion 
d'idéal régulier. 

Dans une algèbre A, un idéal 1 définit 
une relation d’équivalence : a et b, élé- 
ments de A, sont équivalents si a — b 
appartient à I, L’ensemble des classes 
d’équivalence, le quotient A/I, est muni 
d’une structure d’anneau (cf. anneaux et 
algèbres, chap. 3). On dit qu’un idéal I de 
l’algèbre normée commutative A est régu- 
lier si l’anneau quotient A/I est unitaire 
(remarquer que, si A est unitaire, tout idéal 
est régulier). 

Dans une algèbre commutative uni- 
taire, tout idéal propre est contenu dans un 
idéal maximal : il n’en va pas toujours de 
même si l’algèbre n’est pas unitaire. Mais, 
si l’on se borne à considérer les idéaux 
réguliers, on retrouve des propriétés ana- 
logues à celles qui ont été données précé- 
demment : 

a) Tout idéal régulier propre est 
contenu dans un idéal maximal régulier ; 

b) Tout idéal maximal régulier est 
fermé ; 

t‘) Tout idéal maximal régulier est le 
noyau d’un caractère, et d’un seul, et tout 
caractère admet pour noyau un idéal 
maximal régulier. 

Cela définit une bijection entre l’ensem- 
ble des caractères et l’ensemble des idéaux 
maximaux réguliers et cela montre, d’autre 
part, que tout caractère est continu. 

Comme pour les algèbres commutati- 
ves unitaires, on peut définir ici le spectre 
et la transformation de Gelfand : si A(A) 
est l’ensemble des idéaux maximaux régu- 
liers de l’algèbre A, on associe à tout 
élément a de A sa transformée de Gelfand 
a, fonction définie sur A(A) de la même 
manière que précédemment. On munit 


A(A) d’une topologie d’espace localement 
compact, pour laquelle les transformées de 
Gelfand a sont continues et tendent vers 0 
à l’infini. 

Cela étant, la plupart des propriétés 
valables pour les algèbres normées com- 
mutatives unitaires s’étendent au cas non 
unitaire sans modifications essentielles. 

Citons, comme exemple d’ algèbres de 
ce type, l’algèbre des fonctions continues 
sur un espace localement compact X qui 
tendent vers 0 à l’infini : ici le spectre 
s’identifie à X, et les éléments de l’algèbre 
s’identifient à leurs transformées de Gel- 
fand. Un autre exemple est fourni par 
l’algèbre, pour l’opération de convolution, 
des fonctions intégrables sur un groupe 
abélien localement compact non discret, R 
par exemple. 


3. Les algèbres normées 
non commutatives 

L’absence de la commutativité de la mul- 
tiplication interne modifie énormément, 
en la compliquant notablement, la théorie 
des algèbres normées. Faute de pouvoir 
ne serait-ce que l’esquisser, nous nous 
bornerons à indiquer deux classes d’ algè- 
bres de ce type particulièrement impor- 
tantes. 

Les algèbres d'opérateurs 
dans les espaces de Banach 

Reprenons l’exemple (2) du chapitre 1 : E 
étant un espace de Banach. l’ensemble 
L(E) des applications linéaires continues 
de E dans E est une algèbre normée 
unitaire, non commutative si E est de 
dimension supérieure à 1. L’étude de cette 
algèbre est l’un des buts de l’analyse 
fonctionnelle. 
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Il est possible, en particulier, de géné- 
raliser dans ce cadre le calcul fonctionnel 
holomorphe. Soit par exemple T un élé- 
ment de C(E) ; on appellera spectre de T 
l’ensemble o(T) des nombres complexes À 
tels que T — ÀI E , où I E est l’opérateur 
identique, ne soit pas inversible : cela 
correspond à la notion de spectre d’un 
élément dans une algèbre normée commu- 
tative unitaire, défini comme ensemble des 
valeurs prises par la transformée de Gel- 
fand ; si f est une fonction holomorphe 
d’une variable complexe, définie au voisi- 
nage de o(T), on construit un autre élé- 
ment de C(E), noté f (T), de telle sorte que 
l’on ait : 

v+?)(T)=/(T)+?( r r». 

</s)(T)=/Cr>°s(T>; 

on exige de plus f(T) = T" si f est la 
fonction qui à z associe z n . À cela 
s’ajoutent certaines propriétés de conti- 
nuité. Cette construction se fait en utilisant 
la formule intégrale de Cauchy (cf. fonc- 
tions ANALYTIQUES - Fonctions analyti- 
ques d’une variable complexe, chap. 5) ; en 
fait, bien qu’elle ait été particulièrement 
étudiée pour les algèbres d’opérateurs que 
nous considérons ici, elle est possible dans 
le cas le plus général et correspond au 
calcul fonctionnel holomorphe auquel 
nous avons fait allusion dans le cas des 
algèbres normées commutatives unitaires 
(où l’hypothèse supplémentaire de semi- 
simplicité avait pour seul but de rendre 
l’exposé plus concret). 

RENÉ SPECTOR 

les C*-algèbres 

Parmi les algèbres normées, on distingue 
celles dont les propriétés particulières per- 
mettent une analyse spectrale plus pous- 
sée. 


On appelle C*-algèbre une algèbre de 
Banach A vérifiant les deux propriétés 
suivantes : 

(I) elle est munie d’une involution , 
c’est-à-dire d’une application a^a* de A 
dans A telle que l’on ait, quels que soient 
a et b dans A et A complexe : 

(c*)* = a, (a + b)* = a* + b*, 

(Àa)* = \a*, (< ab )* = b*a *, 

A étant le nombre complexe conjugué de 

A ; 

(II) la norme et l’ involution sont liées 
par la relation : 

Il a*a | = ||a || 2 , quel que soit a dans A 

Donnons ici quelques exemples de 
C* -algèbres : 

(1) L’algèbre des fonctions continues sur 
un espace compact ; 

(1’) l’algèbre des fonctions continues mil- 
les à l’infini sur un espace localement 
compact (dans les deux cas l’ involution est 
l’opérateur de conjugaison). 

(2) L’algèbre C(H) des opérateurs bornés 
sur un espace de Hilbert H (F involution 
étant l’opérateur d’adjonction relatif au 
produit scalaire de H) ; 

(2’) toute sous-algèbre fermée de C(H) 
stable par passage à l’adjoint ; 

(2”) en particulier, l’algèbre CC(H) des 
opérateurs compacts de H, c’est-à-dire des 
opérateurs qui sont limite en norme d’opé- 
rateurs de rang fini. 

(3) La C*-algèbre d’un groupe localement 

compact G : sur l’algèbre de convolution 
L*(|u) (cf. ci-dessus l’exemple 3 du chapi- 
tre 1 er ) on construit une involution en asso- 
ciant à la fonction intégrable fia fonction 
/* définie par ; ’), où A 

est la fonction modulaire du groupe ; on 
n’obtient pas ainsi une C*-aigèbre (la 
propriété (II) de la définition n’est pas 
vérifiée), mais on montre qu’il existe sur 
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L’(jLi) une unique norme vérifiant les pro- 
priétés (I) et (II), et l’algèbre de Banach 
obtenue par complétion est une C* -algèbre 
notée habituellement C*(G). 

(1) et (U) fournissent des exemples de 
C*-algèbre commutative : ce sont des 
exemples universels dans la mesure où, 
pour une C*-algèbre commutative, la 
transformation de Gelfand est un isomor- 
phisme. On obtient ainsi le théorème de 
représentation. 

Une C* -algèbre commutative et unitaire 
est naturellement isomorphe à l’algèbre 
des fonctions continues sur son spectre 
(qui est un espace compact) ; 

- Une C*-algèbre commutative est natu- 
rellement isomorphe à l’algèbre des fonc- 
tions continues nulles à l’infini sur son 
spectre (qui est un espace localement 
compact). 

- Cette propriété fondamentale permet de 
définir dans toute C*-algèbre un calcul 
fonctionnel continu : si a est un élément 
normal (i.e. tel que a* et a commutent), on 
peut définir sans ambiguïté V image f (a) de 
(l par une fonction f continue à valeurs 
complexes sur le spectre de a. 

(2) est un exemple de C*-algèbre non 
commutative (si H est l’espace hilbertien 
de dimension 2, on obtient la plus petite de 
celles-ci, l’algèbre des matrices 2X2, qui 
est de dimension 4). 

L’exemple (2’) est universel : toute 
C*-algèbre est isomorphe à une sous- 
algèbre involutive fermée d’un £(H) (mais 
il n’y a pas de manière privilégiée de la 
représenter ainsi). 

L’algèbre des opérateurs compacts (2”) 
joue un rôle fondamental dans toutes les 
théories, anciennes et nouvelles, de classi- 
fication des C* -algèbres et de recherche 
d’invariants. 

Historiquement, les algèbres d’opéra- 
teurs dans l’espace de Hilbert (C*-algèbres 


et algèbres de von Neumann : voir 
ci-dessous) ont été introduites dans les 
années 1930 par J. von Neumann, à la fois 
pour disposer d’un formalisme algébrique 
dans l’étude de certains problèmes de l’ana- 
lyse (l’algèbre des opérateurs différentiels 
par exemple), et également pour interpré- 
ter mathématiquement des phénomènes 
spécifiques de la physique quantique, telle 
l’interdépendance des observations (par 
exemple, l’impossibilité de mesurer simul- 
tanément la position et la vitesse d’une 
particule est formalisée par Heisenberg 
comme une relation de non-commutation 
entre des opérateurs de l’espace hilbertien). 
Le formalisme abstrait que nous avons 
présenté est dû à L M. Gelfand. 

Rapidement, les C*-algèbres se révèlent 
un outil important de l’analyse harmoni- 
que, et la C* -algèbre C*(G) (exemple 3 
ci-dessus) peut être considérée comme un 
« objet dual » du groupe localement com- 
pact G (dans le cas où G est commutatif, 
la transformation de Gelfand identifie 
C*(G) et l’algèbre C,(G) des fonctions 
nulles à l’infini sur le groupe dual G, ce qui 
est une autre manière d’écrire la dualité de 
Pontriaguine). 

D’une manière heuristique, on peut 
considérer les C* -algèbres comme des 
« espaces localement compacts non com- 
mutatifs », considérer leur théorie comme 
une « topologie non commutative », leurs 
formes linéaires comme des « mesures non 
commutatives », etc. Dans ses développe- 
ments récents (investigation d’invariants 
homotopiques et K-homologiques), leur 
étude tend même à s’imposer comme une 
« géométrie différentielle non commuta- 
tive », se révélant un moyen d’investiga- 
tion irremplaçable de strutures différen- 
tielles qui présentent une composante 
dynamique : action d’un groupe de Lie sur 
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une variété, et, plus généralement, toutes 
les structures de variété feuilletée. 

Le cadre et les méthodes de la topologie 
algébrique ont été renouvelés par l’intro- 
duction systématique des C*-algèbres (tra- 
vaux de G. Kasparov et A. Connes). Les 
C*-algèbres ont démontré leur aptitude à 
fournir et élucider des invariants topolo- 
giques pour les structures différentielles. 
L’effort porte aujourd’hui principalement 
sur la K-homologie algébrique (cf. algèbre 
TOPOLOGIE) et ses rapports avec la géomé- 
trie différentielle ; il peut être résumé par 
ses résultats les plus importants : 

- le théorème de périodicité de R. Bott 
qui, reformulé, fournit des suites exactes 
de K-homologie à six termes (alors que les 
suites exactes d’homologie sont en prin- 
cipe infinies) et permet des calculs expli- 
cites ; 

le théorème de l’indice de M. F. Atiyah 
et I. M. Singer, dans la version achevée 
d'A. Connes, permet de relier des inva- 
riants dynamiques d’une variété feuilletée 
(l’indice analytique des opérateurs pseudo- 
différentiels le long des feuilles, interprété 
comme un élément de K-homologie du 
fibré cotangent au feuilletage) à des inva- 
riants de nature purement algébrique 
(l’indice topologique, interprété comme un 
élément de la K-homologie de la C* -algèbre 
canoniquement associée au feuilletage). 

Algèbres de von Neumann 
Une algèbre de von Neumann est une 
sous-algèbre involutive de l’algèbre C(H) 
des opfratcurs bornés d’un espace de 
Hilbert H (cf. ci-dessus l’exemple 2’) qui 
vérifie l’une des trois propriétés équivalen- 
tes suivantes : 

a) elle contient l’opérateur identité et elle 
est fermée pour la topologie de la conver- 
gence simple ; 


b) elle contient l’opérateur identité et elle 
est fermée pour la topologie de la conver- 
gence simple faible ; 

c) elle est égale à son bicommutant (le 
commutant d’une partie P de C(H) est 
l’ensemble des opérateurs bornés de H qui 
commutent à tous les éléments de P ; le 
bicommutant est le commutant du com- 
mutant). 

L’équivalence des propriétés a, b et c est 
connue comme le théorème de commuta- 
tion de J. von Neumann (1929). On peut 
également donner une définition plus abs- 
traite (due à J. Dixmier et S. Sakai) : une 
algèbre de von Neumann est une 
C*-algèbre qui, en tant qu’espace normé, 
est le dual d’un espace de Banach. 

Une algèbre de von Neumann commu- 
tative s’identifie à l’algèbre des (classes de) 
fonctions mesurables essentiellement bor- 
nées sur un espace mesuré. Sur toute 
algèbre de von Neumann, le calcul fonc- 
tionnel des C* -algèbres se prolonge en un 
calcul fonctionnel borélien. 

Pour poursuivre l’analogie du paragra- 
phe précédent, les algèbres de von Neu- 
mann sont des « espaces mesurés non 
commutatifs » et leur théorie, une « théo- 
rie de la mesure non commutative » ; elle 
fait un usage systématique de fonctionnel- 
les non bornées, analogues aux mesures 
dites o-finies, appelées traces et poids : ce 
sont des fonctionnelles positives, densé- 
ment définies, respectant les limites crois- 
santes. 

Les traces sont celles de ces fonction- 
nelles sous lesquelles commute toute paire 
d’éléments dans leur domaine. A partir 
d’elles, les initiateurs de la théorie, 
F. J. Murray et J. von Neumann, avaient 
classé ces algèbres en trois types : type I, 
ou discrètes (dont ia théorie se ramène plus 
ou moins au cas commutatif) ; type II, ou 
continues et à trace (celles qui ne sont pas 
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discrètes mais possèdent suffisamment de 
traces) ; type III, ou purement infinies 
(celles qui ne possèdent aucune trace). Ils 
avaient également démontré un résultat 
d’unicité remarquable : celle d’une algèbre 
de von Neumann continue, à trace finie, à 
centre trivial, qui soit limite inductive 
d’algèbres de matrices (théorème d’unicité 
du facteur hyperfini de type II„ 1943). 

La connaissance de la structure des 
algèbres de von Neumann a fait des 
progrès remarquables. D’abord avec la 
théorie de M. Tomita qui associe à 
tout poids un groupe à un paramètre 
d’automorphismes, le groupe modulaire, 
mesurant exactement son degré de non- 
commutativité ; ensuite avec la classifica- 
tion de A. Connes (dont les travaux sur 
les algèbres de von Neumann et les 
C* -algèbres ont été consacrés par une 
médaille Fields en 1982), fondée sur le 
caractère intrinsèque du groupe modu- 
laire, qui fournit, pour le type III, des 
invariants affinant la typologie de Murray 
et von Neumann, puis généralise le théo- 
rème d’unicité du facteur hyperfini en 
montrant que, pour toute une catégorie 
d’algèbres de von Neumann (à une excep- 
tion près, celles des algèbres dont le centre 
est trivial et qui sont limite inductive 
d’algèbres de matrices), il s’agit d’inva- 
riants complets, c’est-à-dire caractérisant 
l’algèbre à isomorphisme près. 

JEAN-LUC SAUVAGEOT 
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L J analyse fonctionnelle linéaire, en tant 
que théorie générale, s’est créée au 
début du XX e siècle, autour des problèmes 
posés par les équations intégrales. Entre 
1904 et 1906, D. Hilbert (1862-1943) est 
amené à étudier des développements en 
séries de fonctions orthogonales, ainsi que 
des formes quadratiques à une infinité de 
variables. À sa suite, F. Riesz (1880-1 956) 
et E. Fischer (18751959) étudient les 
fonctions de carré intégrdble et la conver- 
gence en moyenne quadratique, puis 
F. Riesz introduit les espaces 1/ pour 
1 < p < + oo et la moyenne d’ordre p. 
Toutefois, ce n’est que vers 1920 que la 
notion d’espace normé abstrait est déga- 
gée, principalement par S. Banach (1892- 
1945), et ce n’est qu’en 1929-1930 que 
J. von Neumann (1903-1 957) propose une 
présentation axiomatique des espaces de 
Hilbert. S. Banach, dans sa thèse de 1920 
intitulée : Sur les opérations dans les 
ensembles abstraits et leur application aux 
équations intégrales , écrit : « L’ouvrage 
présent a pour but d’établir quelques 
théorèmes valables pour différents champs 
fonctionnels, que je spécifie dans la suite. 
Toutefois, afin de ne pas être obligé à les 
démontrer isolément pour chaque-champ 
particulier, ce qui serait bien pénible, j’ai 
choisi une voie différente que voici : je 
considère d’une façon générale les ensem- 
bles d’éléments dont je postule certaines 
propriétés, j’en déduis des théorèmes et je 
démontre ensuite de chaque champ fonc- 
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tionnel particulier que les postulats adop- 
tés sont vrais pour lui. » 

Par la suite, les espaces vectoriels 
normés ont été étudiés de manière auto- 
nome, notamment du point de vue de leur 
géométrie. Parallèlement, l’obligation, en 
théorie des équations aux dérivées partiel- 
les par exemple, de considérer des espaces 
de fonctions dont la topologie n’est pas 
déduite d’une norme a motivé l’introduc- 
tion d’une structure plus générale : celle 
d’espace vectoriel topologique. Toutefois, 
en raison de la spécificité des problèmes et 
des méthodes, les espaces vectoriels nor- 
més ne doivent pas être considérés comme 
de simples cas particuliers d’espaces vec- 
toriels topologiques. De plus, les espaces 
vectoriels topologiques les plus importants 
peuvent être construits en un certain sens 
à l’aide d’espaces vectoriels normés, et 
bénéficient donc pour leur étude des 
propriétés de ces derniers. En retour, les 
espaces vectoriels topologiques intervien- 
nent dans l’étude des espaces normés, 
notamment pour tout ce qui concerne les 
convergences faibles. 

Dans la seconde moitié du XX e siècle, 
l’évolution de la théorie est considérable, 
particulièrement en ce qui concerne la 
géométrie des espaces de Banach et ses 
liens avec les ensembles d’opérateurs que 
l’on peut définir entre les espaces étudiés. 

1. Espaces vectoriels normés, 
espaces de Banach : 
définitions et premières 
propriétés 

Dans ce qui suit, on ne considérera que des 
espaces vectoriels sur le corps R des 
nombres réels ou sur le corps C des 


nombres complexes. Pour éviter de préci- 
ser à chaque fois, on désignera par K ce 
corps de base ; pour a £ K, la notation 0 
désignera donc soit la valeur absolue de a 
si K = R, soit le module de a si K = C. 

Soit E un espace vectoriel sur K. On 
appelle norme sur E une application (notée 
traditionnellement x 1 — ** j| x || ; on dit aussi 
que || jc | est la norme de x) de E dans 
l’ensemble R+ des nombres réels positifs 
ou nuis qui possède les propriétés suivan- 
tes : 

(1) Condition de séparation : 

II* Il = 0<=>* = 0 ; 

(2) Homogénéité : 

Il Ax || = Uli* I, 

quels que soient x £ E et À £ K ; 

(3) Inégalité du triangle : 

+y II ^11* Il -h |j>|| , 

quels que soient x, y £ E. 

Un espace vectoriel muni d’une norme 
s’appelle un espace vectoriel normé. Remar- 
quons que la restriction d’une norme à un 
sous -espace vectoriel est une norme, appe- 
lée norme induite, sur ce sous-espace. Si la 
condition de séparation n’est pas satisfaite, 
on dit qu’on a seulement une semi-norme ; 
l’espace quotient de E par la relation 
d’équivalence : 

x~y&\\x—y\\ = 0 

est alors muni de manière naturelle d’une 
norme, car le nombre ||x|| ne dépend que 
de la classe de .Y (espace norme associé). 

Tout espace vectoriel E est un espace 
métrique pour la distance : 

d(x,y) = \\x—y II, 

déduite de la norme. On peut donc appli- 
quer aux espaces vectoriels normés le 
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langage géométrique de l’analyse (boules, 
ouverts et fermés, convergence, etc.) intro- 
duit dans l’article espaces métriques. 
Remarquons que si d est une distance sur 
un espace vectoriel déduite d’une norme, 
elle possède la propriété suivante (ï inva- 
riance par translation ; 

d(x + z, y + z) = d(x,y\ 

quels que soient .Y, y, Z £ E. Ainsi, les 
boules de centre z sont les translatées des 
boules centrées à l’origine 0 de l’espace 
vectoriel qui s’obtiennent toutes par homo- 
tllétie (d’après l’homogénéité de la norme) 
à partir de la boule unité ouverte : 

B(0, 1) = UEE;|U |< 1} 
ou de la boule unité fermée : 

B/0, 1) = {jcGE ; Ikkl}. 

Ces boules unités sont des ensembles 
convexes, et on peut reconstituer la norme 
à partir de la boule unité par exemple ; on 
suppose ici, bien entendu, K = R 
(cf. convexité r chap. 4). 

On dit qu’un espace vectoriel normé E 
est complet, ou encore est un espace de 
Banach , s’il est complet pour la métrique 
déduite de sa norme. Cela signifie ici 
qu’une suite (.Y„) d’éléments de E est 
convergente si et seulement si : 

lim \\x —x q | = 0 
M - *® 

Si E est un espace vectoriel normé, on 
montre facilement que son complété (au 
sens de la théorie des espaces métriques ; 
cf. espaces métriques, chap. 3) peut être 
muni d’une structure d’espace de Banach 
qui prolonge celle de E. Ainsi, tout espace 
vectoriel normé peut être plongé dans un 
espace de Banach dont il soit un sous-espace 
dense ; ce complété est unique à un isomor- 
phisme d’espace vectoriel normé près. 


Il faut enfin mentionner que les espaces 
vectoriels normés apparaissent comme le 
cadre naturel de la théorie des séries et des 
familles sommables (cf. séries et produits 
INFINIS) . 

Les exemples que nous donnons main- 
tenant fournissent un premier catalogue 
des espaces normés les plus courants. 
Remarquons que lorsque ces espaces 
ne sont pas complets, en vertu de ce qui a 
été dit précédemment, on étudie leur 
complété afin de se ramener à un espace de 
Banach. 

Espaces de dimension finie 
Bien entendu, l’application x*— ► X | est 

une norme sur K considéré comme un 
espace vectoriel de dimension 1 sur 
lui-même (et aussi d’ailleurs de C 
comme espace vectoriel de dimension 2 
sur R). 

Plus généralement, soit E un espace de 
dimension finie n que l’on identifie à K ' 7 
par le choix d’une base. On considère 
usuellement les normes : 


II* L - Sup|x f |, 

n 

II* lit = ^ |*/|, 



i= I 


pour x = (X|, à' 2 , .... X n ) G K" ; en fait, 
pour tout nombre réel positif p > 0, 

/ = î 

est une norme sur K" (espaces de Min- 
kowski). Sur un espace de dimension finie. 
on montre que toutes les normes sont 
équivalentes (cf. définition précise in 
chap. 3) ; cette propriété, comme on le 
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verra ci-dessous, est caractéristique des 
espaces de dimension finie, et la situation 
est fondamentalement différente dans ceux 
de dimension infinie. Les espaces de 
dimension finie sont aussi caractérisés par 
le fait que leur boule unité est compacte 
(théorème de Riesz). Mentionnons enfin 
que tout espace vectoriel normé de dimen- 
sion finie est nécessairement complet. 

La norme ||. || 2 sur C" est associée au 
produit scalaire hermitien : 

(x \y ) = ^ Xjÿjy 

i ^ i 

qui munit C n d’une structure hilbertienne ; 
de manière générale, tout espace préhil- 
bertien E est un espace vectoriel normé si 
on le munit de la norme : 

II* Il = V(x |x), 

en désignant par (x y) le produit hermitien 
de je et y (cf. espace de hilbert) . 

Norme de la convergence uniforme 
Si X est un ensemble, désignons par 
E = $(X, K) l’espace vectoriel des appli- 
cations bornées de X dans K (rappelons 
que l’on a toujours K = R ou C) ; on 
appelle norme de la convergence uniforme 
la norme sur E définie par : 

1/ IL = sup |/(/)| , /GE. 

/ex 

On montre que $(X, K), muni de la norme 
de la convergence uniforme est un espace 
complet. Dire qu’une suite (f n ) de fonc- 
tions converge vers f pour cette norme 
signifie ici que : 

sup|/(0— /„(') | — 0 , » — 

/ex 

c’est-a-dire que la suite des fonctions f n 
converge uniformément vers fi Dans le cas 
où X est un espace topologique, on montre 


que le sous-espace Co/X, K) des applica- 
tions continues bornées de X dans K est 
fermé dans $(X, K) et, par suite (cf. 
espaces métriques, chap. 3), est aussi un 
espace de Banach pour la norme de la 
convergence uniforme. 

Espaces liés à l’intégration 
Soit [a, b] un intervalle fermé borné de R ; 
désignons par C([a , b], K) l’espace vecto- 
riel des fonctions continues définies sur 
[a, b] à valeurs dans K ; pour tout nombre 
réel p ^ 1, on peut considérer la norme : 

i/i,-(]wr. 

appelée norme de la convergence en 
moyenne d’ordre p. Ces normes sont deux 
à deux non équivalentes, et C([a, b\, K) 
n’est complet pour aucune d’entre elles 
(alors que C([a , b], K) est complet pour la 
norme de la convergence uniforme). Le 
complété de C([a , b], K) pour une telle 
norme (cf. espaces métriques, chap. 3) 
n’est autre que l’espace If ([a, b], K) des 
classes de fonctions à valeurs dans K, de 
puissancepième intégrale sur [a, b] pour la 
mesure de Lebesgue (cf. intégration et 
MESURE , chap. 4). Pour p = 2 on obtient 
un espace de Hilbert, la norme étant 
associée au produit scalaire : 

<f\g) = \ b a f(x)W)dx. 

Rappelons qu’une fonction mesurable 
définie sur la, b] à valeurs dans K (cf. 
INTÉGRATION ET MESURE , chap. 3) est dite 
essentiellement bornée par M si la mesure 
de l’ensemble des x tels que \f(x) > M est 
nulle ; la borne supérieure essentielle, notée 
||/ 1*, est le plus petit M réalisant la 
condition précédente. 

L’espace L“ (la, b], K) des classes de 
fonctions essentiellement bornées sur [a, b] 
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à valeurs dans K est normé par || f | x ; c’est 
alors un espace de Banach. 

Il existe d’autres exemples intéressants 
d’espaces de Banach liés à l’intégration, 
notamment les espaces d’Orlicz (cf. CONVE- 
XITÉ ■ Fonctions convexes). 

Espaces de suites 

Sur l’espace t° des suites bornées d’élé- 
ments de K on peut définir la norme : 

!«l- = suç|b,|, 


Dans toute la suite, les espaces / x , c, c 0 , 
l j \ LP ([a, b], K) seront considérés comme 
normés de la façon indiquée dans les exem- 
ples D’autre part, du point de vue des 
notations, lorsque aucune confusion n’en 
résulte, on se permettra de noter C(X), 
LP ([a, b]) les espaces C(X,K), LP ([ci, b], 
K). 

Continuité d'une application linéaire 

Soit E et F des espaces vectoriels normés 
sur K (égal à R ou C) et : 

u : E— ► F 


où U est la suite de terme général u n ; on 
obtient ainsi un espace de Banach. Remar- 
quons que cet exemple peut être considéré 
comme un cas particulier de norme de 
convergence uniforme sur un espace 
Æ(X, K) de fonctions bornées en prenant 
X = N. 

L’espace c 0 des suites d’éléments de K 
qui convergent vers 0 (et sont donc bor- 
nées), muni de la norme induite par la 
norme || || * de Z 33 , est un espace de 

Banach ; c’est un sous-espace fermé de / 
On dispose d’un résultat analogue pour 
l’espace c des suites convergentes d’élé- 
ments de K. 

Pour p ^ 1 on définit l’espace i p des 
suites u — ( u n ) n ^ o d’éléments de K telles 

E ] u„ | p < -4- oo ; muni de la norme : 

I «I 

iun=( jr iu, \ÿ\ 

n = 0 

l p est un espace de Banach. Dans le cas 
p = 2, on obtient un espace de Hilbert, 
la norme étant déduite du produit sca- 
laire 


(K 


v) = 


une application linéaire , c’est-à-dire telle 
que : 

u(Xx + \yy) = Xu(x) + \xu{y), 

quels que soient x, y E E et A, p E K. Les 
trois conditions suivantes, apparemment 
de plus en plus fortes, sont en fait équi- 
valentes : 

(1) L’application u est continue au point 
OEE; 

(2) L’application u est continue partout ; 

(3) Il existe une constante M telle que : 

||w(x)|| F < M||* ] E , 

pour tout x E E (on exprime cette condi- 
tion en disant que u est borné). 

Ainsi, la continuité en un seul point (on 
se ramène à l’origine par translation) 
entraîne que u est uniformément continue 
(et même lipschitzienne, cf. espaces métri- 
ques, chap. 2), car on a (la linéarité est bien 
entendu ici essentielle) : u(x) — w(jO 
= w(x — y), d’où : 

||w(x) — u(y)\\ < M||* — y II . 

Cette importante propriété rend les 
applications linéaires continues redevables 
des résultats relatifs aux applications uni- 
formément continues. Le théorème de 
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prolongement (cf. espaces MÉTRIQUES, 
chap. 3) donne ici : soit E un espace 
vectoriel normé, E’ un sous-espace dense et 
u : E’ — ► F une application linéaire conti- 
nue de E’ dans un espace de Banach F ; 
alors il existe un prolongement linéaire 
continu unique ü : E — ► F à l’espace E tout 
entier (la linéarité du prolongement est 
évidente par continuité). 

Comparaison de normes 

Considérons deux normes || . || , et |j| 2 sur 
un même espace vectoriel E et désignons 
par E, et E 7 les espaces vectoriels normés 
correspondants. On dit que la norme || . || , 




est plus fine que la norme || . || 2 si l’appli- 
cation identique de E| dans E? est continue, 
ce qui signifie que tout ouvert pour la 
norme | . || est un ouvert pour la norme 

Mi- 

La condition ci-dessus montre que cela 
équivaut à dire qu’il existe une constante 
a > 0 telle que : 

II* Il 2 < « I* 11, 

pour tout Y E E. On dit que les deux 
normes sont équivalentes si elles définissent 
les mêmes ouverts, c’est-à-dire s’il existe 
des constantes strictement positives a et b 
telles que : 

b II* lli < \\x \\ 2 < a \\x |l 

Par exemple, si E et F sont des espaces 
vectoriels normés de normes respectives 
|| . || et || . | on obtient sur E X F trois 
normes équivalentes en prenant pour 
norme de l’élément (.Y, >’) E E X F respec- 
tivement l’un des trois nombres : 

sup ( IU II, I \y II '), I* Il +1 \y VII* II 2 +\\y II' 2 - 

On montre que, sur un espace vectoriel 
de dimensionjnic, toutes les normes sont 
équivalentes, mais inversement ce n’est 
plus nécessairement le cas en dimension 
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infinie, comme le démontre l’exemple de 
l’espace E = C([0, 1]) muni des normes : 

||/L= sup |/(r)|, ||/||,= f 1 \f(t )\dt -, 

0 t <• 1 Jo 

on a ici \\f || , \\f H», et, par suite, la 

norme de la convergence uniforme est plus 
fine que la norme de la convergence en 
moyenne, mais ces deux normes ne sont 
pas équivalentes. Il suffit pour s’en 
convaincre de remarquer que la suite (f ) 
d’éléments de E, définie par : 

l —nt + 1, 

r ii \ I H 


converge en moyenne vers la fonction 0 
mais ne converge pas uniformément, car 

Wfn II, = 1/(2») et ||/„ « oo — 1 . 

Norme d’une application linéaire 
Si E et F sont des espaces vectoriels 
normés, on désigne par C ( ,(E, F) l’espace 
vectoriel des applications linéaires conti- 
nues de E dans F. La présence du c en 
indice est destinée à éviter la confusion 
avec l’ensemble de toutes les applications 
linéaires (continues ou pas) de E dans F 
que les algébristes notent (cf. algèbre 
linéaire ET MULTILINEAIRE) L(E, F) ; dans 
la pratique, cet indice saute, car le contexte 
indique toujours assez clairement si on 
impose la continuité ou pas... Dans ce qui 
suit, nous ne considérerons que des appli- 
cations linéaires continues et, le lecteur 
(éventuel) étant prévenu, nous désignerons 
par C(E, F) l’espace vectoriel des applica- 
tions linéaires continues de E dans F. 

On vérifie que l’application : 

u * *■ || u 11= sup !«(*)!, k E £ (E, F), 

St* IU 1 

est une norme sur l’espace vectoriel L(E, 
F). Le nombre | u || s’appelle la norme de 


l’application linéaire u et admet aussi les 
expressions : 

II" 11= sup \\u(x)\\= sup ïï ; 

ainsi, c’est la plus petite constante M telle 
que l’on ait : 

M*)ll < M||* I, 

pour tout * E E. 

On montre que l’espace vectoriel 
normé C(E, F) est complet si et seulement 
si F est complet. En particulier, le dual 
topologique C(E, K), qui est l’espace vec- 
toriel des formes linéaires continues sur E, 
est toujours un espace de Banach ; on le 
note E* (ne pas confondre avec le dual 
algébrique). 

Remarquons enfin que si E, F et G sont 
trois espaces vectoriels normés, si u : 
E — ► F et v : F — ► G sont des applications 
linéaires continues, alors on a : 

Il « o v II a II u II II v II 

en particulier, l’algèbre L(E, E) = C(E) des 
endomorphismes d’un espace vectoriel 
normé est une algèbre normée pour la 
norme introduite ci-dessus (cf. algèbres 

NORMÉES) . 

Hyperplans fermés 

Soit E un espace vectoriel normé et F un 
sous-espace vectoriel de E. Si x et y appar- 
tiennent à l’adhérence F de F dans E, cela 
signifie qu’il existe des suites (x„) et (y„) 
d’éléments de F qui convergent respective- 
ment vers x et y ; pour A, p E K, la suite 
(Ax„ + d’éléments de F converge vers 
Xx + |Li}’ qui appartient donc aussi à F. 
Ainsi, l’adhérence d’un sous-espace vecto- 
riel est un sous-espace vectoriel. Si F est un 
sous-espace de dimension finie de E, on 
montre qu’il est toujours fermé, mais, dans 


735 



NORMÉS ESPACES VECTORIELS 


les espaces de dimension infinie, il peut exis- 
ter des sous-espaces distincts de leur adhé- 
rence. comme on va le voir. 

Rappelons (cf. algèbre linéaire et MUL- 
TILINÉAIRE, chap. 4) qu’on appelle hyper- 
plan d’un espace vectoriel tout sous-espace 
strict maximal, c’est-à-dire de codimen- 
sion 1 ; si H est un hyperplan de E, il existe 
une forme linéaire u : E — ► K, unique à un 
scalaire près, telle que H soit le noyau de u 
(on dit que u(x) = 0 est l’équation de 
T hyperplan). Supposons E normé et soit H 
un hyperplan ; l’adhérence H est un SOUS- 
espace vectoriel de E qui contient H, et par 
suite, d’après la maximalité de H, on a soit 
H = H, c’est-à-dire que I’hyperplan H est 
fermé , soit H = E, c’est-à-dire que T hyper- 
plan est dense dans E. On montre facile- 
ment que, avec les notations données 
ci-dessus, l’ hyperplan H est fermé si et seu- 
lement si la forme linéaire u est continue. 

La notion d’ hyperplan partout dense 
étant peu intuitive, donnons un exemple 
simple de cette situation. Soit E l’espace 
vectoriel des polynômes à coefficients 
réels, muni de la norme de la convergence 
uniforme sur [0, 1], c’est-à-dire : 

||P||= sup | P(f ) | , PEE; 

0 * tç 1 

la forme linéaire u définie par : 

u(P) = P (2) 

n’est pas continue, car la suite (P„), définie 
par P n (/ ) = {t/2) n , converge vers 0 dans 
E ; en effet, | P„ || — (1/2)"), alors que 
w(PJ = 1 ne converge pas vers 0. Il en 
résulte que l’espace vectoriel des polynô- 
mes P qui admettent le nombre 2 pour 
racine forme un hyperplan partout dense 
de E. 

Isomorphismes, isométries 

Une application linéaire bijective u d’un 

espace normé E sur un espace normé F 


telle que u et u _1 soient continues est un 
isomorphisme de E sur F ; deux espaces 
normés E et F sont isomorphes s’il existe un 
isomorphisme de E sur F ; du point de vue 
topologique, les espaces E et F sont 
homéomorphes (cf. topologie générale , 
chap. 1 ). Compte tenu de ce qui a été dit 
sur la continuité des applications linéaires, 
pour qu’une application linéaire surjective 
de E sur F soit un isomorphisme il faut et 
il suffit qu’il existe deux constantes C, > 0 
et C? > 0 telles que pour tout élément A' de 
E : 

cj* IIE<|k(x)|| f <C 2 il* NE. 

(Remarquons que l’injectivité est consé- 
quence de l’inégalité C, | x || p ^ || u(x) || p et 
de la linéarité de w, si bien que si u n’est 
pas surjective on peut tout de même dire 
que u est un isomorphisme de E sur u(E).) 

Une application linéaire bijective u d’un 
espace normé E sur un espace normé F 
telle que pour tout a de E | u(x) || p — | x || p 
est une isométrie , ou encore un normiso- 
morphisme de E sur F ; s’il existe une 
isométrie de E sur F, les espaces E et F sont 
dits isométriques ou encore normisomor- 
phes. 

Tous les espaces de Banach de même 
dimension finie il sur K sont isomorphes : 
en revanche, ils ne sont pas tous isométri- 
ques comme le montre la considération des 
normes | || 2 et || | x par exemple. Si 

1 ^ p < q < + oc, aucun sous-espace 
fermé de dimension infinie de l p n’est 
isomorphe à un sous-espace de l (j ; aucun 
sous-espace fermé de Cq n’est isomorphe à 
un sous-espace de l p . Kj et Ko étant deux 
espaces compacts, C (K„ R) et C (K 2 , R) 
sont isométriques si et seulement si K, et 
sont homéomorphes ; C ([0,1], R) et 
c ([0,1] X [0,1], R) ne sont donc pas iso- 
métriques ; on peut montrer cependant 
qu’ils sont isomorphes. 
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2. Les théorèmes généraux de base 

Entre 1920 et 1930, S. Banach, H. Hahn, 
H. Steinhaus élaborent les théorèmes géné- 
raux de base de la théorie. 

Théorème de Hahn-Banach 
Il existe diverses versions de ce théorème ; 
nous donnons ici une version analytique 
valide dans les deux cas : K = R ou 
K = C. Nous renvoyons à l’article conve- 
xité pour une forme géométrique de ce 
résultat. 

Soit E un espace vectoriel sur K, p une 
semi-norme sur E (cf. chap. 1) et f une 
forme linéaire sur un sous-espace F de E 
qui pour tout x de F vérifie |/(x) ^ p(x). 
II existe alors une forme linéaire g sur E qui 
prolongefet qui vérifie g(x) ^ p(x) pour 
tout x de E. 

Les quatre théorèmes qui suivent repo- 
sent de manière essentielle sur la propriété 
de B aire des espaces métriques complets 
(cf. espaces métriques, chap. 4). 

Théorème de l’application ouverte 
Soit E et F deux espaces de Banach et u 
une application linéaire continue surjective 
de E sur F. L’image par u de tout ouvert 
de E (cf. TOPOLOGIE GÉNÉRALE, chap. 1 ) est 
alors un ouvert de F. 

On déduit immédiatement de ce théo- 
rème que si de plus u est injective alors u est 
un isomorphisme de l’espace de Banach E 
sur l’espace de Banach F. En particulier, 
lorsqu’un espace vectoriel E est muni de 
deux normes qui en font toutes deux un 
espace de Banach, il suffit de montrer que 
ces normes se comparent pour en conclure 
qu’elles sont équivalentes. 

Théorème du grapjie fermé 

Soit E et F deux espaces de Banach. Pour 

qu’une application linéaire U de E dans F 


soit continue, il faut et il suffit que son gra- 
phe soit fermé dans l’espace produit E X F. 

Théorème d’équicontinuité 
de Banach 

Soit (T,-) 0 une famille d’applications li- 
néaires continues d’un espace de Banach B 
dans un espace vectoriel normé F. On sup- 
pose que, pour tout élément x de B, 
sup|| T,(x) || < + c» ; alors sup || T, J < + oo, 

/E I /El 

Théorème de Banach-Steinhaus 

Soit E et F deux espaces de Banach et 

(T/j)/j 6 N une su 4e d’applications linéaires 

continues de E dans F. Alors lim T,(x) 

n - r 

existe pour tout x élément de E si et 

seulement si lim T,(x) existe pour tout 
n - s 

x d’un sous-ensemble dense de E et 
sup J T,(x) | < + oo pour tout x élément 

de E. Quand la limite T(x) existe pour tout 
élément x de E, l’application T est linéaire 

continue et || T | lim inf || T n ||. 

n-m 

3. La décomposition 
des espaces de Banach 

Produits d’espaces de Banach 
E et F étant deux espaces de Banach, la 
somme directe E © F (cf. algèbre linéaire 
et MULTILINÉAIRE, chap. 2) peut être munie 
d’une structure d’espace de Banach dont la 
topologie associée soit la topologie produit 
de celle de E par celle de F (cf. TOPOLOGIE 
générale, chap. 1). Il y a en fait plusieurs 
normes qui réalisent cette condition, les 
plus utilisées étant || (x, y) || p = 

(NI e'’ + IMI F / ’)' // \ où 1 ^ P < +00 et 
II (x, y) I „ = max (|| x || E , || y || E ). Évidem- 
ment, ces normes sont équivalentes et les 
espaces de Banach obtenus sont isomor- 
phes. 
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La complémentation 

Soit E © F une décomposition en somme 
directe algébrique de l’espace de 
Banach X. E et F étant munis des topo- 
logies induites par celle de X, et E © F de 
la topologie produit, nous dirons que 
E © F est une décomposition en somme 
directe topologique si l’application 

<p : E © F— *X 

{x,y)~x + y 

est un homéomorphisme. 

En utilisant le théorème de l’application 
ouverte, on montre que pour qu’une 
décomposition en somme directe E © F de 
l’espace de Banach X soit topologique il 
faut et il suffit que E et F soient des 
sous-espaces fermés de X. 

Le problème de la complémentation qui 
se pose alors est de savoir si, étant donné 
un sous-espace vectoriel fermé E d’un 
espace de Banach X, il existe un supplé- 
mentaire topologique de E dans X, c’est- 
à-dire un sous -espace F de X tel que E © F 
soit une décomposition en somme directe 
topologique de X ; on dira dans ce cas que 
E est complémenté dans X. On montre que 
pour qu’un sous-espace fermé E de X soit 
complémenté dans X il faut et il suffit qu’il 
existe une projection continue P de X sur 
E ; alors E © (I — P)(X), où 1 est l’appli- 
cation identique, est une décomposition en 
somme directe topologique de X. Il n’est 
pas vrai en général que tous les sous- 
espaces fermés d’un espace de Banach 
soient complémentés : par exemple, 
n’est pas complémenté dans l x . Toutefois, 
la propriété indiquée est réalisée dans les 
espaces de dimension finie et dans les 
espaces de Hilbert (cf. espace de HILBERT , 
chap. 3) et elle caractérise ces espaces ; 
plus précisément 

a) Soit E un espace de Banach dans 
lequel il existe pour tout sous-espace F 


fermé de E une projection continue de 
norme 1 de E sur F ; alors E est isomé- 
trique à un espace de Hilbert. 

b) Soit E un espace de Banach dans 
lequel il existe pour tout sous-espace F 
fermé de E une projection continue de E 
sur F ; alors E est isomorphe à un espace 
de Hilbert. 


Bases de Schauder 

Soit (Xi) iEN une suite d’éléments d’un 
espace de Banach E telle que tout élé- 
ment x de E se décompose de manière 

unique sous la forme X = ■*? W*» 

I — O 

où les x*(x) sont des éléments de K (qui 
dépendent évidemment de x). Dans ces 
conditions, les applications : 

x*:E^K 

x^x*(x) 

sont des formes linéaires continues, c’est- 
à-dire des éléments de E*. On dit alors que 
la suite (a',) /gn est une base de Schauder 
de E. Dans les espaces c 0 , l p 
(1 ^ p < + oo), la suite (e t ) ieN , où 

e, = (5, v -) /£N (5 ij = 0 si i ^ j, bjj = 1 si 

i = j) est une base de Schauder. Dans 
l’espace de Banach C[0,1] muni de la 
norme de la convergence uniforme, la suite 
de fonctions définie par : 


/ 0 (O = i./i(O = f. 


r 


0 si f g 


2r — 2 2 r 

I 2* +1 * 2* +1 . 


fl k +r (t ) = 


1 s i 


t 


_2r — i 

2* + i 


V. affine sur 


2r — 2 2r — 


2*+! 

2r~ 


1 


2 k + 


2 k + \ 

1 2r 

l ’ 2 k + \ ■ 


(r— 1,2, 2 k ; k= 0, 1, constitue 
une base de Schauder. 
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Dans un espace de Banach E muni 
d’une base de Schauder, les combinaisons 
linéaires finies à coefficients rationnels 
d’éléments de la base forment une famille 
dénombrable dense dans E : l’espace E est 
séparable. La plupart des espaces de 
Banach séparables que l’on rencontre sont 
munis de bases de Schauder ; on peut 
néanmoins construire des espaces de 
Banach séparables qui n’en possèdent pas. 


4. Les propriétés d’approximation 

On supposera désormais que K = R. 

Une application linéaire d’un espace 
vectoriel E dans un espace vectoriel F est 
dite de rang fini si son image est un SOUS- 
espace de dimension finie de F. X et Y étant 
deux espaces de Banach et / une applica- 
tion linéaire continue de rang fini de X dans 
Y, il est clair, d’après le théorème de Riesz 
(cf. chap. 1), que l’adhérence dans Y de 
l’image parfde la boule unité fermée de X 
est une partie compacte de Y, c’est-a-dire 
quefest un opérateur compact. Comme on 
sait d’autre part que dans L c (X, Y) muni de 
la norme des applications linéaires conti- 
nues une limite d’opérateurs compacts est 
un opérateur compact, la question qui se 
pose est de savoir si, pour des espaces de 
Banach X et Y arbitraires, tout opérateur 
compact de X dans Y est limite dans C t . (X, 
Y) muni de la norme indiquée d’une suite 
d’opérateurs de rang fini. Ce problème, dit 
problème de l’approximation, n’a été 
résolu par la négative qu’en 1973 par P. 
Enflo ; il a donné lieu a l’étude de divers 
énoncés équivalents et à la mise en place de 
quelques propriétés voisines extrêmement 
importantes (ces travaux sont essentielle- 
ment dus à A. Grothendieck). On dit que 
l’espace de Banach X possède la propriété 
d’approximation (la A.P.) si, pour tout 


compact Q de X et tout £ > 0, il existe une 
application linéaire continue T de rang fini 
telle que pour tout X de Q on ait |T V — 
X 1 ^ 6. Soit À un réel ^ 1 , si on impose à 
T la condition supplémentaire d’être de 
norme inférieure à À, on dit alors que X a 
la A-propriété d’approximation (À-A.P.). 
Lorsqu’il existe un réel A tel que l’espace de 
Banach X ait la A-A.P., on dit que X a la 
propriété d’approximation bornée 

(B.A.P.).Enfin,siXala l-A.P.,onditqu’il 
a la propriété d’approximation métrique. 
On montre que l’espace de Banach X a la 
A.P. si et seulement si, pour tout espace de 
Banach Y, tout opérateur compact de X 
dans Y est limite dans t c (X, Y) muni de sa 
norme usuelle d’une suite d’applications 
linéaires continues de rang fini. 

On sait qu’il existe des espaces de 
Banach qui n’ont pas la A.P. et qu’il existe 
des espaces de Banach qui ont la A.P. mais 
n’ont pas la B. A.P. Soit un espace de 
Banach X ayant une base de Schauder 
(A')/EN> l a considération des opérateurs 

n 

de rang fini T„ défini par T,(x) = y 

/ = O 

x*(x) Xj montre que X a la B. A.P. ; on ne 
sait pas par contre si tout espace de Banach 
séparable ayant la B. A.P. possède une base 
de Schauder. 


5. Intégration des fonctions 
à valeurs vectorielles. 

Mesures à valeurs vectorielles 

L’intégration des fonctions à valeurs vec- 
torielles et les mesures à valeurs vectoriel- 
les sont des outils intéressants qui permet- 
tent en particulier grâce à des théorèmes de 
représentation de mieux étudier certaines 
propriétés géométriques des espaces de 
Banach. 
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Intégration des fonctions 
à valeurs vectorielles 

(Q, ü, |ll) est un espace mesuré par une 
mesure positive finie p ; X est un espace de 
Banach et 3\ x est la tribu borélienne de X 
(Cf. intégration et mesure). Une applica- 
tion / de Q dans X est dite fortement mesu- 
rable si c’est une application mesurable 
(c’est-à-dire si l’image réciproque par / de 
tout élément de $ x est un élément de U) et 
s’il existe un sous-espace fermé séparable X 0 
de X et un élément Q 0 de ü de mesure nulle 
tels quef (O Q 0 ) C X 0 . 

Une application / de Q dans X est dite 
simple si elle est mesurable et si son image 
est un sous-ensemble fini de X. 

Une fonction simple non nulle 
s’écrit alors de manière unique sous la 
forme : 

/= ^Tx A *„ 

i = 1 

où les x } sont des éléments non nuis deux 
à deux distincts de X, où les A, sont des 
éléments non vides deux à deux disjoints de 
la tribu U et où X A est la fonction 
caractéristique de l’ensemble A,. On peut 
alors définir l’intégrale de la fonction 

n 

simple /= £ X A, x , par rapport à la 

i = l 

mesure p en posant : 

j/rfp = P(A,)X, 

I = 1 

(on attribuera à la fonction nulle l’inté- 
grale 0). 

Toute fonction / de Q dans X, forte- 
ment mesurable, est limite presque partout 
d’une suite de fonctions simples ; cela nous 
suggère de définir l’intégrale de certaines 
fonctions fortement mesurables grâce à 
une approximation par des fonctions sim- 


ples ; cette démarche est possible grâce au 
lemme suivant : 

Lemme. Soit (/'„)„ et (f*) m deux 
suites de fonctions simples qui convergent 
presque partout vers la même fonction sim- 
ple / et telles que, pour i = 1 et 2, 
lim Jd !/»(«) - fm (<■>) | d\t = 0. Alors, les 

m — oc 

limites lim J A /^(o)) c/p (/ = 1 et 2) existent 

pour tout A élément de U (et même unifor- 
mément par rapport à A) et sont égales. 

On peut donner alors la définition 
suivante : 

Définition. Une fonction fortement 
mesurable /, de Q dans X, est dite inté- 
grable au sens de Bochner (ou B-intégrable) 
s’il existe une suite (f n ) n de fonctions 
simples qui converge vers / presque par- 
tout et telle que : 

lim J q Il f n («) —f m («) Il d p = 0. 

m — ° ° 

Par définition, on pose alors : 

f = lim f f n (u)d\i. 

do n — Jo 

Théorème. Une fonction fortement 
mesurable / de Q dans X est B-intégrable 
si et seulement si Jq ||/(g)) || c/p < + oo ; 
dans ce cas, on a de plus l’inégalité : 

llf /(«)<*!■ Il < f II/(o>)Um. 

Jq Jq 

De la même façon que pour les fonc- 
tions à valeurs réelles ou complexes, on 
définit l’espace 1^(0, U, p, X) des classes 
de fonctions B -intégrables de Q dans E 
(Cf. INTÉGRATION et mesure, ehap. 4), ainsi 
que les espaces ]_f (Q, U, p, X), où 
1 ^ p ^ + °°- 

Mesures à valeurs vectorielles 

Soit (Q, U) un espace mesurable et X 

un espace de Banach. Une application F 
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de U dans X est une mesure si elle est 
T-additive : pour toute suite (A,), d’élé- 
ments deux à deux disjoints de Ç : 

F ( U A ') = t F(A,.), 

/ = o “ 5 

et si F(0) = 0. 

Notons F l’application de U dans 
R + définie par : 

I F | (A) = sup V II F(B) Il , 

IÏ€P / > 

B€n 

où P est l’ensemble de toutes les partitions 
finies de A en éléments de ü ; F est une 
mesure positive ; quand F est une mesure 
finie, on dit que la mesure F est à variation 
bornée. Si maintenant p est une mesure 
positive finie sur l’espace mesurable (E, U) 
et si F est une mesure définie sur (E, U) à 
valeurs dans X, on dira que F est 
p-continue lorsque lim F(A) = 0. 

M (A)—0 

On peut montrer que, pour que F soit 
u-continue, il faut et il suffit que, pour tout 
élément A de ü tel que p(A) — 0 , on ait 
aussi F(A) = 0. 

La propriété 
de Radon-Nikodym 

Théorème. Soitfun élément de L'(E, S, n, 
X) ; alors la fonction F de ü dans X définie 
par : 

F(A) = J A /(u)dM 

est une mesure à variation bornée et : 

F (A) = J a || /(o) | rf M . 

Contrairement à ce qui se passe dans le 
cas de mesures à valeurs réelles ou com- 
plexes, la réciproque de ce théorème est 
fausse. On est amené à introduire la 
définition qui suit. 


Définition. On dit qu’un espace de 
Banach X a la propriété de Radon- 
Nikodym si, pour tout espace mesuré (Q, 
ü, p) par une mesure positive finie p, et 
pour toute mesure à variation bornée F de 
U dans X y-continue, il existe un élément 
f de L 1 (E, G, p, X) tel que pour tout A 
élément de ü on ait : 

F(A) = J A /(«)rfM. 

Cette propriété a des applications inté- 
ressantes du point de vue des opéra- 
teurs : 

Définition. Soit (Q, G, p) un espace 
mesuré par une mesure positive finie p. On 
dit qu’un opérateur T de L 1 (Q, ü, p) dans 
un espace de Banach X admet une repré- 
sentation de Riesz s’il existe un élément g 
de L°° (Q, G, p, X) tel que pour tout 
élément f de L 1 (Q, G, p) : 

tv) = f 

JiQ 

Théorème. Un espace de Banach X a la 
propriété de Radon-Nikodym si et seule- 
ment si, pour tout espace mesuré (Q, U, p) 
par une mesure positive finie p, tout 
opérateur T de L 1 (Q, ü, p) dans X admet 
une représentation de Riesz. 

La propriété de Radon-Nikodym a 
d’autre part un aspect géométrique très 
important : 

Définition . Un sous-ensemble borné B 
d’un espace de Banach X est dit dentable si, 
pour tout £ > 0, il existe un élément .y de B 
qui n’appartient pas à l’enveloppe convexe 
fermée de B — B(x, e), où B(JC, e) est la 
boule ouverte de centre x et de rayon 8. 

Théorème. Un espace de Banach X 
possède la propriété de Radon-Nikodym si 
et seulement si tout sous-ensemble borné 
de X est dentable. 

ROBERT ROLLAND et JEAN-LUC VERLEY 
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NUMÉRATION 


L e problème de la numération est celui 
de la désignation des nombres. Les 
nombres sont définis de manière intrinsè- 
que, indépendamment de leur nom, et la 
façon de les désigner dépend du langage, 
du « code » choisi. Pour comprendre en 
quoi consiste la numération, il est impor- 
tant d’abord de savoir distinguer un nom- 
bre de ses représentations dans divers 
« systèmes de numération ». Nous ne rap- 
pelons d’abord ici que les notions élémen- 
taires concernant les nombres entiers natu- 
rels. 

Les entiers naturels 
Bijections 

Une application /d’un ensemble A sur un 
ensemble B est dite une Injection lorsque : 
tout élément de B est l’image parfd’un 
Elément de A (suijection) ; 


deux éléments distincts de A ont tou- 
jours pour images par f deux éléments 
distincts de B (injection). 

Lorsqu’il existe une bijection de A sur 
B, il en existe aussi une de B sur A, et on 
dit que A et B ont autant d’éléments. C’est 
une notion très simple, car on peut voir si 
deux ensembles ont autant d’éléments sans 
compter ces éléments. 

Ainsi, les bergers de l’Antiquité utili- 
saient des cailloux (d’où le nom de 
« calcul ») pour faire rentrer le soir autant 
de moutons qu’ils en avaient fait sortir le 
matin ; de même, lorsqu’on voit de nom- 
breux couples danser sur une scène, malgré 
l’animation et sans compter, on sait immé- 
diatement qu’il y a autant d’hommes que 
de femmes ; remarquons enfin que, dès 
l’école maternelle, les enfants savent qu’ils 
ont autant de doigts à une main qu’à 
l’autre, aux mains qu’aux pieds, qu’il y a 
autant de tasses que de soucoupes, etc., et 
cela parce qu’ils savent réaliser les bijec- 
tions correspondantes. 

Cardinaux 

Plusieurs ensembles d’objets étant donnés, 
on peut opérer un classement en rangeant 
dans une même « classe » les ensembles 
ayant autant d’éléments. Les ensembles 
d’une même classe sont dits « éqilipo- 
tents ». Ces exercices présentent l'incon- 
vénient de ne porter que sur des ensembles 
finis, mais permettent de bien mettre en 
évidence la notion d’équipotence entre 
ensembles. 

L’équipotence entre ensembles est 
réflexive, symétrique et transitive, mais on 
peut remarquer que l’on commet un abus 
de langage lorsqu’on dit que c’est une 
« relation d’équivalence ». En effet, les 
relations sont définies seulement sur des 
ensembles, or l’équipotence est définie sur 
la « collection de tous les ensembles », de 
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même que l’appartenance ou l’égalité des 
ensembles. 

Les cardinaux peuvent être considérés 
comme les « classes d’équivalence » déter- 
minées par cette « pseudo-relation » sur la 
collection de tous les ensembles : les 
ensembles d’une même classe ont donc en 
commun la propriété d’avoir « même car- 
dinal ». 

Nombres entiers 

Aspect « cardinal » 
On peut être tenté de définir le « nombre 
d’éléments » d’un ensemble comme la 
propriété commune à tous les ensembles 
qui ont même cardinal que lui ; dans ce cas, 
« nombre » et « cardinal » seraient syno- 
nymes. Mais, en réalité, seuls les cardinaux 
finis sont des nombres entiers. 

On peut prendre comme définition : Un 
ensemble est fini si et seulement s’il n’est 
équipotent à aucune partie stricte de lui- 
même. 

Aspect «ordinal » 

Si l’on construit une suite d’ensembles 
dont le premier est vide et tels que, à partir 
du deuxième (auquel on donnera le 
numéro un), chacun s’obtient en recopiant 
le précédent et en lui adjoignant un objet 
et un seul, c’est-à-dire que chaque ensem- 
ble a exactement « un objet de plus » que 
le précédent, ce qu’on matérialise ainsi 
n’est autre que la construction des « ordi- 
naux finis » par : 

0, ( 0 )> (0, (0}), {0, (0M0, (0)}}, ... 

qui sont respectivement de cardinal : 

O, 1, 2, 3, 

Or deux ordinaux finis de même cardi- 
nal sont isomorphes ; on peut sans danger 
les confondre et les identifier à leur cardi- 
nal ; mais, selon les situations, c’est l’aspect 


ordinal ou l’aspect cardinal du nombre 
naturel considéré qui intervient. 

Numération des entiers naturels 
L’ensemble des entiers naturels étant cons- 
truit, la question se pose de « nommer » 
ces nombres oralement et par écrit, 1 1 
apparaît vite qu’il n’est pas possible 
d’inventer un nom pour chaque nombre 
indépendamment des précédents ; il est 
encore moins possible de lui trouver un 
symbole pour l’écriture. Chaque civilisa- 
tion s’est donc donné un « alphabet » 
particulier et des règles de formation pour 
les « mots », au sens de « combinaisons de 
symboles », 

Le système adopté par la civilisation 
occidentale utilise actuellement les symbo- 
les : 

« 0 », « 1 », « 2 », « 3 », « 4 », 

« 5 », « 6 », « 7 », « 8 », « 9 » 

qui constituent l’alphabet à partir duquel 
on écrit les nombres en appliquant le 
principe dit de « numération de position » 
avec une base constante. 

Numération de position 
à base constante 

Soit B un entier naturel fixe, dit « base » ; 
une unité de chaque ordre vaut B unités de 
l’ordre précédent. 

Par suite de l’unicité du quotient et du 
reste dans la division euclidienne (cf. 
divisibilité, chap. 1), tout entier naturel a 
peut s’écrire d’une manière et d’une seule 
sous la forme : 

a = a 0 + ajB -f a 2 B 2 -f ... -f a n B n , 

où les Æq, a„ . . . . a, sont des entiers naturels 
strictement inférieurs à B et où a, est non 
nul. 

La numération de position revient à 
représenter le nombre en écrivant seule- 
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ment les coefficients de ce polynôme (mais 
tous les coefficients nuis ou non, de 
manière que leur place soit définie sans 
ambiguïté), donc à désigner le nombre 
précédent par : 

B 

a n a n -1 a 2 a \ a 0 y 

ou, plus généralement, lorsque aucune 
confusion n’est possible, en omettant 
l’indication de la base, par : 


a n a n — 1 a 2 a l a 0 

et même sans surlignage par : 

a n a n - 1 ■ (*2 a 1 a 0- 

Ainsi, le nombre « neuf » s’écrit : 

9 <du;) ou T00l <deu ' ) ou !00 ( " oi!) , etc. 

Une erreur est à éviter : il faut se garder 
de lire « mill e un » pour 100 1 Ueux) . on 
lire la suite des chiffres écrits de gauche à 
droite dès que le nombre est écrit dans une 
base différente de dix. Il serait également 
maladroit d’écrire la base en chiffres, car 
on ne saurait pas de quel nombre il s’agit 
(sauf lorsque l’on convient que les bases 
sont toujours exprimées dans la base dix, 
par exemple). 

Le système décimal est le système de 
numération de position où la base est dix, 
c’est-a-dire que les unités du deuxième 
ordre (les « dizaines ») valent dix unités du 
premier ordre, les unités du troisième 
ordre (les « centaines ») valent dix unités 
du deuxième ordre, etc. Prenons, par 
exemple, 8 345 : 

8345 = 5 + 4 X 10 + 3X 10 2 + 8X 10 3 . 

Le système binaire est le système de 
numération de position où la base est 
deux : l’alphabet est composé des deux 
seuls chiffres 0 et 1. Ce système est très 


utilisé, en informatique par exemple, car 
les machines à deux états peuvent réaliser 
une représentation des nombres entiers 
par leur désignation binaire, les deux états 
de la machine étant, dans le code, la 
traduction du 0 et du 1. Ainsi, « neuf » 
peut être codé par un top suivi de deux 
blancs puis d’un autre top. 

Lorsque la base est supérieure à dix, il 
est nécessaire d’adjoindre aux chiffres 
habituels de nouveaux symboles, Par 
exemple, en base douze, on utilisera : 

« 0 », « 1 », « 2 », « 3 », « 4 », « 5 », 

« 6 », « 7 », « 8 », « 9 », « a », « p ». 

Numération de position 
à base non constante 

On peut voir que, dans de nombreuses 
civilisations, le système de numération est 
un système positionnel à base non cons- 
tante : il est analogue au système défini plus 
haut, mais les unités des divers ordres ne 
sont pas toutes les puissances de l’unité du 
premier ordre. Les unités de chaque ordre 
étant définies, tout nombre naturel s’écrit 
encore d’une manière et d’une seule dans 
le système déterminé par ces unités en 
opérant des divisions euclidiennes succes- 
sives comme dans les cas à base constante. 

Comparaison de deux nombres 
et opérations 

Deux nombres écrits dans le même sys- 
tème de numération de position peuvent 
être comparés : on a vu qu’un même 
nombre ne peut s’écrire que d’une seule 
manière dans un système donné. Soit deux 
nombres U et b : 

a = a„ —, a„ b = 6 m 6 m _! b 0 ; 

si m < /?, alors b < a ; si m > n, alors 
b > a ; si m = n, alors, ou bien, si a n =*£ b }V 
a et b sont dans le même ordre que a,, et 
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b m ou bien, si a„ = b m a et b sont dans le 
même ordre que Cl ( et b h l’entier i étant le 
plus grand entier p tel que Cl p b p . 

Pour les opérations, le système de 
numération a des implications sur les 
techniques opératoires (retenues) : la 
désignation du résultat d’une opération sur 
les entiers naturels est fonction de la 
désignation de ces nombres. 

Apprentissage de la numération 

On peut présenter, dès l’école primaire, 
des situations mettant en lumière les prin- 
cipes de numération que nous venons 
d’énoncer. 

Citons d’abord des numérations à buse 
non constante : 

™ dans de nombreux jeux, les enfants 
comptent les points gagnés en utilisant des 
jetons tels que, par exemple, cinq ronds 
valent un carré, deux carrés valent un 
rectangle, etc. ; 

- utilisation des pièces de monnaie cou- 
rantes (centimes, sous, francs) ; 

- décompte des voix obtenues à des 
élections en dessinant des blocs de cinq 
traits : par exemple, □ i5 U donne treize ; 
calendrier et mesure du temps. 

Les exemples d’enseignement scolaire 
de la numération à base constante sont 
évidemment nombreux : 

- le boulier traditionnel, très utilisé encore 
actuellement dans certains pays pour 
l’apprentissage des opérations ; 

les exercices de groupement par paquets 
(trois billes dans un sac, trois sacs dans une 
boîte, trois boîtes dans une caissette, etc.) ; 

- le solfège : dès huit ans, les enfants 
savent qu’une ronde vaut deux blanches, 
une blanche vaut deux noires, une noire 
vaut deux croches, une croche vaut deux 
doubles croches... ; ils utilisent donc ici la 
« numération binaire » ; 


- le matériel pédagogique : les « blocs 
multibases » utilisés dans l’enseignement 
primaire sont des ensembles de petits 
cubes, de barres, de plaques carrées et de 
grands cubes ; pour compter en base trois, 
par exemple, on utilise des petits cubes, des 
barres formées de trois petits cubes acco- 
lés, des plaques formées de trois barres et 
des cubes formés de trois plaques ; les 
enfants, pour compter le nombre d’élé- 
ments d’un ensemble d’objets, ont, 
d’abord, à prendre « autant » de petits 
cubes qu’il y a d’objets (en établissant une 
bijection), puis ils les regroupent, rempla- 
cent chaque ensemble de trois petits cubes 
par une barre, puis chaque ensemble de 
trois barres par une plaque et chaque 
ensemble de trois plaques par un grand 
cube (ce procédé ne permet pas de repré- 
senter des nombres à l’aide d’unités 
d’ordre supérieur au quatrième ordre) ; 

- le « compteur humain » binaire (jeu 
présenté par T. L. Fletcher in L'Appren- 
tissage de la mathématique aujourd’hui ) : 
« Plusieurs enfants sont alignés (les mains 
baissées). Il leur est précisé que, dans la 
suite, leur main droite doit être nettement 
dirigée vers le haut ou vers le bas. L’enfant 
situé le plus à droite reçoit l’instruction de 
changer de position (du haut vers le bas ou 
du bas vers le haut) à chaque signal, un 
claquement de mains du professeur, par 
exemple ; les autres changent de position 
quand la main de l’enfant à leur gauche se 
dirige en bas. » 

C’est là une réalisation pédagogique du 
principe même des compteurs. 

Nombres à virgule 

De nombreux codages utilisés dans la 
pratique sont fondés non pas sur l’ordre 
des entiers, mais sur celui des nombres à 
virgule : par exemple les cotes des livres 
dans les bibliothèques modernes, le numé- 
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rotage des maisons de certaines rues en bis, 

ter.. 

On y est amené lorsqu’on veut pouvoir 
intercaler des éléments entre deux élé- 
ments quelconques. Il s’agit d’un ordre 
analogue à celui des dictionnaires ; c’est 
pourquoi on l’appelle aussi « ordre lexico- 
graphique ». Cette question est en relation 
avec celle du repérage sur une demi-droite. 

Construction de nombres 

à virgule binaires 

Entre 0 et 1 on introduit un nombre noté 
« 0,1 » ; entre 0 et 0,1 on introduit un 
nombre noté « 0,01 » ; entre 0 et 0,01 on 
introduit un nombre noté « 0,001 » ; etc. 
De même, entre 1 , 1 et 1,11 on introduit un 
nombre noté « 1.101 », etc. 

Un nombre à virgule binaire s’écrit 
donc comme un nombre entier en base 
deux suivi d’une virgule et d’une suite de 
« 0 » et de « 1 » en nombre fini avec la 
propriété que tout nombre est égal à tous 
ceux qu’on peut écrire en adjoignant des 
zéros à sa droite. Par exemple : 

101,100 = 101,1000 = 101,1. 

Nombres à virgule de base quelconque 

On construit les nombres « décimaux » à 
partir des nombres naturels en introdui- 
sant neuf nouveaux nombres entre deux 
nombres naturels consécutifs, puis encore 
neuf nombres entre deux nombres consé- 
cutifs ainsi déterminés, et ainsi de suite. 

L’ensemble des entiers naturels appa- 
raît donc comme sous-ensemble de 
l’ensemble des nombres décimaux, et 
ceux-ci sont écrits avec les symboles « 0 », 
« 1 », « 2 », « 3 », « 4 », « 5 », « 6 », « 7 », 
«8 », « 9 » et le symbole de virgule « , ». 

De même que les nombres à virgule 
binaires ou décimaux, on peut considérer 
des nombres à virgule de n’importe quelle 


base. Il faut cependant noter que, tandis 
que pour les entiers naturels changer de 
base revenait à changer le nom des mêmes 
nombres, ici la base intervient dans la 
définition des nombres eux-mêmes ; par 
exemple, le nombre à virgule ternaire 0,1 
n’est pas un nombre décimal, car il s’agit 
du nombre rationnel 1/3 dont on sait que 
ce qu’on appelle le « développement déci- 
mal » s’écrit « 0 , 333 . .. 3 ... » avec une 
infinité de chiffres « 3 ». 

JOSETTE ADDA 
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L es relations d’ordre interviennent 
de manière naturelle dans des ques- 
tions comme l’étude des liens de parenté 
et celle des liens de subordination, comme 
les problèmes de classification, etc. C’est 
de là, et de la relation entre nombres, 
que découle la terminologie habituelle- 
ment employée : on dit que a est « plus 
petit » que b , que a est « dominé » par b, 
que b est « plus haut » que a, etc 
Remarquons que cette situation inclut 
l’égalité a = b ; on précise que, de plus, 
a ^ b, en ajoutant l’adverbe « stricte- 
ment ». 

La théorie des ensembles ordonnés 
comporte une partie élémentaire qui est 
exposée ici, mais constitue aussi un cha- 
pitre important de la « grande » théorie 
des ensembles en liaison étroite avec 
l’axiome du choix dont plusieurs formula- 
tions équivalentes s'expriment en terme 
d’ordre. La théorie des ordinaux, due à 
Cantor, s’exprime aussi dans ce cadre. 


Rappelons enfin que c’est à partir de la 
relation d’ordre usuel sur l’ensemble des 
nombres rationnels que R. Dedekind, en 
1872, a donné la première construction 
rigoureuse de l’ensemble des nombres 
réels. 

Relations d'ordre 

On dit qu’une relation Oi sur un ensemble 
E est une relation d’ordre (cf. théorie 
élémentaire des ENSEMBLES , chap. 2) si elle 
satisfait aux axiomes suivants : 

(0,) Réflexivité : pour tout élément a de 
E, on a la relation a ( Âü ; 

(0 2 ) Antisymétrie : les relations cRRh et 
bïRa ne sont compatibles que pour a = b ; 
(0,) Transitivité : les relations a "Rb et b!Rc 
impliquent aiRc. 

Par exemple, la relation est une 
relation d’ordre sur tout sous-ensemble de 
l’ensemble R des nombres réels. 

Etant donné deux nombres réels dis- 
tincts a et b, on a toujours une, et une seule, 
des relations a ^ b ou b a. Plus géné- 
ralement, si E est un ensemble muni d’une 
relation d’ordre 31, on dira que deux 
éléments a et b sont comparables si on a au 
moins une des relations a‘Rb ou Mia. Si 
deux éléments quelconques d’un ensemble 
ordonné E sont toujours comparables, on 
dit que E est totalement ordonné, ou 
encore que l’ordre est total, ou linéaire. 
Dans le cas contraire, on parle d’ordre 
partiel. 

Un exemple d’ordre partiel 

Soit X un ensemble ; la relation d’inclusion 
C est une relation d’ordre sur l’ensemble 
E r= W(X) des parties de X (cf. théorie 
élémentaire des ensembles, chap. 1). Sur la 
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figure 1, on a représenté le diagramme 
sagittal de cette relation dans le cas où 



X = {a, |3, y} est un ensemble à trois 
éléments : pour a, b (E :I'(X), on a : 

aCb , 

si a = b ou s’il existe une ou plusieurs 
flèches « consécutives » du diagramme 
partant de a pour aboutir à b. Les parties 
{ p} et {a, y}, par exemple, ne sont pas 
comparables et l’ordre n’est donc pas 
total. 

intervalles 

Soit E un ensemble ordonné et a et b des 
éléments de E avec a plus petit que b . On 
appelle intervalle ouvert d’origine a et 
d’extrémité b , noté Ja bl l’ensemble des 
éléments ,Y de E qui sont strictement plus 
grands que a et strictement plus petits que 
b (donc en particulier comparables à a et 
à b). Ainsi on a, dans l’exemple précédent 
illustré par le diagramme de la figure 1, 

]{tx},{oc, P, y,} [ = {{a, PI, {a, T }}. 


On définit de même, pour a plus petit 
que b , l'intervalle fermé [a, b] qui est 

l’ensemble des éléments x de E qui sont 
plus grands que a et plus petits que b : c’est 
l’intervalle ouvert ]a , b[ augmenté de ses 
deux extrémités. 

Majorants 

Soit E un ensemble ordonné et A un 
sous-ensemble de E. On dit qu’un élément 
m de E est un majorant de A si tout élément 
de A est plus petit que m (ce qui implique 
que tout élément de A est comparable à 
m) ; si A admet au moins un majorant, on 
dit que c’est un ensemble majoré. Dans le 
cas où, de plus, m appartient à A, on dit 
que A admet un plus grand élément ; il 
résulte de (0 2 ) que ce plus grand élément 
m, s’il existe, est unique. 

Reprenons encore l’exemple ci-dessus, 
illustré par le diagramme de la figure 1, 
avec : 

A = {O, (al, [a, |3 UP,t}]; 

cet ensemble admet pour majorant m = 
{a, (3, y), mais n’admet pas de plus grand 
élément. L’élément {(3, y} de A n’est pas 
un plus grand élément (car il n’est pas 
comparable à {a, (3}), mais possède la 
propriété plus faible qu’il n’existe pas 
d’élément de A qui soit strictement plus 
grand que lui : on dit que c’est un élément 
maximal. 

Borne supérieure 

Soit toujours E un ensemble ordonné et A 
un sous-ensemble de E que nous suppose- 
rons majoré. Tout élément de E plus grand 
qu’un majorant de A est a fortiori un 
majorant de A et il est donc intéressant de 
chercher des majorants le plus petits pos- 
sible. On dit que A admet une borne 
supérieure si l’ensemble de ses majorants 
a un plus petit élément ; cet élément, 
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nécessairement unique, s’appelle la borne 
supérieure de A et on le note : 

sup A. 

Bien entendu, on définirait de même la 
notion de borne inférieure. 

Dans le cas des nombres réels, tout 
ensemble majoré admet une borne supé- 
rieure (cf. CALCUL INFINITÉSIMAL - Calcul à 
une variable, chap. 1) et c’est cette impor- 
tante propriété qui permet de « faire de 
l’analyse », alors que l’existence de lacunes 
dans l’ensemble des nombres rationnels 
met cette propriété en défaut : c’est ainsi 
que l’ensemble des nombres rationnels 
dont le carré est strictement inférieur à 2 
n’admet pas de borne supérieure dans Q ; 
dans R, sa borne supérieure est le nombre 
(irrationnel) V'J. 

Lorsque l’ordre est total, tout SOUS- 
ensemble fini a un plus grand élément ; 
mais il n’en est plus de même si l’ordre est 
partiel. Étant donné deux éléments a et b, 
on désigne par : 

sup {a, b ) 

la borne supérieure (si elle existe) de 
l’ensemble {a, b). Par exemple, si l’ensem- 
ble E = IJP(X) des parties d’un ensemble X 
est ordonné par inclusion, soit a et b deux 
parties de E. Une partie c est « plus 
grande » que Q et que b, c’est-à-dire a C c 
et b C c\ si, et seulement si, a U b C c ; la 
réunion a U b est donc le plus petit majo- 
rant commun à a et à b, c’est-à-dire la 
borne supérieure. Raisonnant de même 
pour la borne inférieure, on a donc dans 
notre exemple : 

sup (a, b) = a U b } inf (a, b) - a fl b. 

On appelle treillis tout ensemble 
ordonné dans lequel deux éléments quel- 
conques ont toujours une borne supérieure 
et une borne inférieure ; la théorie des 


treillis est une branche de l’algèbre qui a de 
nombreuses applications tant en mathé- 
matiques pures qu’en mathématiques 
appliquées. 

Quelques ordres sur N* 

On peut munir l’ensemble N* des entiers 
naturels strictement positifs de diverses 
relations d’ordre qui montreront bien la 
grande variété de propriétés que l’on peut 
obtenir ainsi. 

Après la relation ^ usuelle, la relation 
d’ordre la plus courante est la relation de 
divisibilité : 

p\q. 


si p divise q , c’est-à-dire si q est multiple de 
p : cela signifie qu’il existe un entier 
m E N* tel que q = mp. Sur la figure 2, on 



a représenté le diagramme sagittal de 
l’ordre ainsi obtenu sur l’ensemble des huit 
diviseurs du nombre 30. On remarque la 
parfaite analogie avec l’ensemble des par- 
ties de X = {a, (3, y] ordonné par inclu- 
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sion ; plus généralement, on dit que deux 
ensembles ordonnés sont isomorphes s’il 
existe une bijection de l’un sur l’autre qui 
respecte les ordres. 

La relation de divisibilité ne définit pas 
un ordre total, car 2 et 3, par exemple, ne 
sont pas comparables. Si p et q sont deux 
entiers, l’ensemble des « majorants » com- 
muns est l’ensemble des multiples com- 
muns dep et de q ; cet ensemble a un « plus 
petit » élément, le plus petit commun 
multiple (P. P. C. M.) de p et de q, qui est 
donc la borne supérieure de p et de y pour 
la relation de divisibilité. On interpréterait 
de même le P. G. C. D. (plus grand com- 
mun diviseur) de p et de y comme la borne 
inférieure de p et de q 9 ce qui donne une 
structure de treillis. 

Très différente est la relation d’ordre 
suivante sur N*, qui intervient dans une 
démonstration du théorème de d’Alembert 
sur les racines d’une équation algébrique. 
On remarque d’abord que tout entier \\ 1 

s’écrit de manière unique sous la forme : 

n = 2’ (26 + 1), 

avec b G N*. Cela signifie que n est 
divisible par 2 C \ mais pas par 2 a+l ; 
le quotient de n par 2 Ü est alors un 
entier impair, donc de la forme 2 b + 1. 
Par exemple, 72 est divisible par 8 = 2 3 
mais n’est pas divisible par 16 = 2 4 ; 
le quotient de 72 par 8 est le nombre 
impair 9 = 4X 2+1, d’où l’on a 
72 = 2 3 (4 X 2 + 1). 

Pour n = 2" (2b + 1) et 

n' = 2 a '(2 b' T- 1) on dira que n est 
dominé par n’, et on notera n ^ II’, si 
on a : 

a < a' 

ou si on a simultanément : 

a = a', b O' ; 


on définit ainsi une relation d’ordre total 
très différente de l’ordre usuel. Par exem- 
ple 31 ^ 2 ou 12 ^8. L’intervalle ouvert 
]2, 14 [ contient les nombres 6 et 10, mais 
l’intervalle ]2, 12[ contient une infinité 
d’éléments, à savoir tous les nombres de la 
forme 2(2 k + 1), k ^ 1, et le nombre 4 
qui est son plus grand élément. 

L’ordre lexicographique 

Un ordre important dans les applications 
les plus variées (pour tous les problèmes de 
classification en sciences humaines, par 
exemple) est l’ordre lexicographique. Il est 
familier à tous ceux qui ont consulté un 
dictionnaire. 

Soit X un ensemble ordonné par ^ que 
nous appellerons un alphabet. On appelle 
mot toute suite finie d’éléments de X, sans 
se préoccuper du sens éventuel de ce mot 
dans une langue naturelle. Par exemple, si 
X est l’alphabet usuel, constitué par nos 
vingt-six lettres, 

abbeda, encyclopédie 
sont des mots. 

L’ordre lexicographique se définit 
alors sur l’ensemble E des mots de la 
manière suivante. Si x = X\Xi x p et 
} ? = y \}'2 y 7 q sont des mots > on dira que : 

x ^ y 

si on a p ^ q et = y„ x 2 = J+ • • • • 
x p = y,„ ou si, désignant par k le plus petit 
entier tel que X/. + J+ on a + J+ Ainsi, 
si l’un des deux mots n’est pas obtenu en 
rajoutant des lettres à l’autre, on classe ces 
mots en examinant la première lettre qui 
diffère, par exemple : 

aba < abaa < abd. 

ANDRÉ WARUSFEL 
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ORTHOGONAUX polynômes 


C ) est à travers l’étude de certains 
problèmes d’analyse fonctionnelle 
(équations intégrales, skies de Fourier, 
problème de Sturm-Liouville et, plus géné- 
ralement, problèmes aux limites dans les 
équations aux dérivées partielles) qu’est 
apparue la notion de système orthogonal 
de fonctions. Ces problèmes amènent à 
considérer des espaces hermitiens consti- 
tués de fonctions et à déterminer les 
valeurs propres et les fonctions propres 
(cf. théorie spectrale) de certains endo- 
morphismes de ces espaces. Dans le cas 
d’un opérateur hermitien, les sous-espaces 
propres sont orthogonaux deux à deux. Le 
problème essentiel consiste alors à cher- 
cher des bases hilbertiennes constituées de 
fonctions propres. 

& 

Équation intégrale de Fnedholm 

Soit E un ensemble muni d’une mesure 
positive p et k une fonction de carré 
intégrable sur EXE. Pour toute fonction 
f de carré intégrable sur E et pour presque 


tout élément x de E, la fonction 
y k (x, y) f {y) est intégrable sur E et la 
fonction g, définie presque partout par la 
formule : 

g (* ) = Je k (x, y)f(y) d p (y), 

est de carré intégrable sur E. L’application 
U*, dite associée au noyau k, qui à tout 
élément f de L’(E) associe g, est un 
endomorphisme de L’(E). Lorsqu’on 
munit L 2 (E) de la norme de la convergence 
en moyenne quadratique, cet endomor- 
phisme est continu et sa norme est infé- 
rieure à ]| k |] 2 i cet endomorphisme est 
même un endomorphisme compact. La 
résolution de l’équation intégrale de Fred- 
holm : 

(1) £ k (x, y)f(y) d\i(y) — Kf(x) = h (*), 

où h est un élément donné de L 2 (E), 
conduit à chercher les valeurs propres et 
les vecteurs propres de F endomorphisme 
U k . Lorsque le noyau k est hermitien, 
c’est-à-dire lorsque, pour tout couple (x, y) 
d’éléments de E, k(y, x) = k(x, y), alors 
l’endomorphisme compact \J k est hermi- 
tien. La théorie spectrale montre que 
l’ensemble Sp(U / r) des valeurs propres de 
\J k est une partie bornée dénombrable de 
R, dont tous les points, sauf peut-être 0, 
sont isolés. De plus, les sous-espaces pro- 
pres E x sont orthogonaux deux à deux et 
le sous-espace vectoriel : 

F= ® Ex 

*esp(U fc ) 

est dense dans L 2 (E). Enfin, E est de 
dimension finie si A 0. Il existe donc une 
suite (A„) de nombres réels convergeant 
vers 0 et une base hilbertienne (cp„) de 
L 2 (E) telles que, pour tout entier n , 

Ut (cp„) = K <p«- Une telle base 
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s’appelle système orthogonal associé au 
noyau k. Enfin, la suite (A,) est de carré 
sommable : 


+ 00 

n — 0 

et le noyau k peut se développer de la 
manière suivante : 


k(x,y)= X n cp„ (x) 

n =0 

Pour résoudre l’équation intégrale (1), 
on décompose le second membre h dans la 
base hilbertienne précédente : 


h = ^ a.<P„ a„=(h<r„). 


Pour que : 


/= ^ 
n = 0 

soit solution de (1), il faut et il suffit que, 
pour tout entier naturel 

(A„-À)P„ = a ,. 


E. Schmidt (1907) et T. Mercer (1909) 
ont trouvé des conditions assez larges 
sous lesquelles la convergence est uni- 
forme. 

La théorie spectrale d’opérateurs her- 
mitiens plus généraux conduit encore à des 
théories analogues. Signalons le cas des 
séries de Fourier (cf. analyse HARMONIQUE, 
espace de hilbert) et celui des fonctions 
sphériques (cf. groupes - Groupes de Lie). 
Nous allons nous borner ici à un cas 
particulièrement simple. 


Polynômes orthogonaux 

Soit 1 un intervalle de R non réduit à un 
point et p une fonction à valeurs réelles 
continue sur 1, telle qu’en tout point x 
intérieur à 1, p (x) > 0. Soit C i(p) l’espace 
vectoriel des fonctionsfà valeurs comple- 
xes continues sur I telles que : 

jVwi < +«. 

On munit Cj (p) du produit hermitien : 
(f, s) ~(f\g) = ^/(xjgjxjp (x) dx. 


En particulier, lorsque A n’appartient 
pas à sp(U*) U {0}, l’équation (1) admet 
une solution et une seule. Lorsque 
À G sp(U,) U {0}, pour que (1) admette 
une solution, il faut et il suffit que h soit 
orthogonale au sous-espace vectoriel E,. 
Enfin, lorsque A = 0, pour que (1) admette 
une solution, il faut et il suffit que h soit 
orthogonale au noyau de U* et que : 




Kl 2 

XI 


< + °°, 


où P désigne l’ensemble des entiers n tels 
que A„ # 0. 

On notera que les séries précédentes 
convergent en moyenne quadratique. 


L’espace hermitien Cj(p) n’étant pas 
complet, on est amené à le considérer 
comme un sous-espace vectoriel L \(p) des 
classes de fonctions f mesurables sur 1 à 
valeurs complexes et telles que : 

< +»• 

Muni du produit hermitien précédent, 
L fo) est un espace hilbertien. 

Plaçons-nous dans l’un des deux cas 
suivants : 

u) L’intervalle 1 est borné et p est 
intégrable sur 1, c’est-à-dire que : 

| p (x) dx < + oo. 
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b) L’intervalle 1 est non borné, p est 
intégrable sur I et à décroissance rapide à 
l’infini, c’est-à-dire que, pour tout entier n , 

lim X n p (*) = 0 

* — ±® 

Les fonctions monomiales e n : x * x" 
appartiennent alors à Cj(/?). La suite (P,) 
des fonctions polynomiales déduite de la 
famille (e,) par orthonormalisation est 
appelée système depolynômes orthogonaux 
sur I associé au poids p ; pour tout entier 
naturel la suite (P,) est un polynôme à 
coefficients réels de degré n, et le coefficient 
dominant de (P,) est strictement positif. 

Réciproquement, soit (Q,) une suite 
orthogonale de polynômes à coefficients 
complexes telle que, pour tout entier n , le 
polynôme Q n soit de degré n. Pour tout 
entier n, il existe un nombre complexe X n 
et un seul tel que Q n = X n Ÿ n ; plus préci- 
sément : 

*. = (Qn P»)- 

En utilisant le fait que P f1 est orthogonal 
à tout polynôme de degré inférieur ou égal 
à n 1, on prouve facilement les résultats 
suivants : 

Pour tout entier naturel non nul n , il 
existe un triplet (a„, (3„, y„) de nombres 
réels et un seul tel que : 

P*+i(*) =(<*„■*+ P*)P !.(*)+ Y„P„-i(*) 

(formule de récurrence linéaire à deux 
termes) ; en outre, oc„ est strictement posi- 
tif et strictement négatif. 

Toutes les racines de F n sont réelles, 
simples et intérieures à 1 et, pour tout 
entier naturel non nul n , les racines de P w 
séparent celles de P^+j. 

Enfin, lorsque l’intervalle I est symétri- 
que par rapport à 0 et que la fonction p est 
paire, le polynôme P„ est pair si n est pair, 
impair si n est impair, et (3, ? = 0. 


Il reste à examiner si la suite (P„) est une 
base hilbertienne ou, ce qui revient au 
même, si le sous-espace vectoriel engendré 
par les fonctions e„ est dense dans C,(p). 

Lorsque l’intervalle I est borné, il en est 
toujours ainsi ; cela résulte du théorème 
d’approximation de Weierstrass et du fait 
que, sur un intervalle borné, la conver- 
gence uniforme implique la convergence 
dans Ciip), 

Lorsque l’intervalle I n’est pas borné, il 
peut arriver que (P,) ne soit pas une base 
hilbertienne, par exemple si p (x) = 
exp (- | x | a ), où a G ]0, 1[. Cependant, 
lorsque p est à décroissance exponentielle, 
c’est-à-dire lorsque p est dominée par une 
fonction de la forme X exp (— (X X ), 
où a > 0, au voisinage de ± <x>, la suite est 
une base hilbertienne de Lq (p) et a fortiori 
de C,(p). En effet, tous les moments 
M w = if e n ) d’un élément f de Lf (p) 
orthogonal aux polynômes P„ sont nuis. 
D’autre part, la décroissance exponentielie 
du poids p permet de prouver que la bande 
de convergence de la transformée de 
Laplace de fp est non vide. On en déduit 
alors que fp est nulle presque partout et 
que f est nulle presque partout. Le pro- 
blème de la recherche de conditions por- 
tant sur p pour que la suite (P„) soit une 
base hilbertienne (problème de Bernstein) 
est assez délicat ; il a fait l’objet de travaux 
de A. Denjoy (1922) et de T. Carleman 
(1932) et, plus récemment, de W. Pollard 
(1956) et de J. -P. Ferrier (1965), qui ont 
obtenu des conditions nécessaires et suf- 
fisantes. 

Équations différentielles 

des polynômes orthogonaux 

Soit 1 = [a, p] un intervalle compact de R, 

a et b deux fonctions à valeurs réelles 

indéfiniment dérivables sur I, la fonction a 

ne s’annulant pas sur l’intérieur de I et 
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admettant un zéro simple aux points a et 
(3. On considère l’équation différentielle : 

(1) ay'+by'=Xy, 

où A est un nombre complexe. De telles 
équations interviennent, par exemple, dans 
les problèmes de Sturm-Liouville. Les solu- 
tions de (1) sont les fonctions propres de 
l’endomorphisme U \f ■— * af " + bf de 
l’espace vectoriel E des fonctions indéfi- 
niment dfrivablcs sur I. Pour étudier 
l’équation (1), on introduit sa fonction 
résolvante, c’est-à-dire une fonction Y à 
valeurs réelles strictement positives, défi- 
nie sur l’intérieur de I vérifiant l’équation 
différentielle : 


(ru)' = rb ; 


alors : 


U(f> = - W )'■ 


Supposons que les nombres : 




H g) MP) 

a '(<*)’ a\\ 3) 


soient réels strictement positifs. Dans ce 
cas, (je — a) ^r(x)ü(x) admet une limite 
finie non nulle au point a et ((3 — A') u 
r(x)a(x) admet une limite finie non nulle au 
point (3. Par suite, pour tout couple {f, g) 
d’éléments de E, la fonction rfg est inté- 
grable sur I. 

On peut donc définir un produit her- 
mitien sur E par la formule : 


(/l*> = \\{x)f(x)g’(x)dx. 


L’endomorphisme U est alors hermi- 
tien ; plus précisément : 


(U(/) |g) — (/ 1 U (g)) 

= —^M)a^)fix)s(x)dx. 


Dans beaucoup de cas intervenant en 
pratique, on peut déterminer une base 
hilbertienne de E constituée de vecteurs 
propres de U. Nous nous contentons ici 
d’examiner le cas où a et b sont des 
fonctions polynomiales de la forme sui- 
vante : 


a(x) = (x — a)(x — P), 

b(x) = p; + 6, y=£0. 

Pour tout entier naturel /?, le SOUS- 
espace vectoriel E„ de E constitué des 
fonctions polynomiales de degré inférieur 
ou égal à n est stable par U. Les conditions 
p > 0 et v > 0 sont équivalentes aux 
conditions ay + 6 > 0 et (3 y -f - 5 > 0. 
De plus : 

r(x) = (jc — cO^-HP — *) v ~ 1 

est une résolvante de U. Le système (P,) de 
polynômes orthogonaux associé au poids r 
est une base hilbertienne de E constituée 
de fonctions propres de U ; plus précisé- 
ment : 


U(P„) = n (n + y - 1)P„. 

Les polynômes P„ s’appellent polynô- 
mes de Jacobi. Dans le cas où p = v = 1, 
on trouve les polynômes de Legendre ; 
dans le cas où p = v = 1/2, on trouve les 
polynômes de Tchebichev, ainsi que dans 
le cas où p = v = 3/2. 

Soit maintenant 1 un intervalle de la 
forme [a, + oo[. On suppose cette fois que 
les fonctions a et b , ainsi que toutes leurs 
dérivées, sont des éléments de l’espace 
vectoriel E des fonctions à croissance lente 
au voisinage de -j- où, et on considère U 
comme un endomorphisme de E. On 
suppose que p = fr(a) / ü (a) > 0 et que, 
d’autre part, b(x) / a(x) admet une limite 
strictement négative v, finie ou infinie, 
lorsque x tend vers -j- oc. Pour tout couple 
(f, g) d’éléments de E, la fonction rfg est 
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alors intégrable sur I, et U est encore 
hermitien pour le produit hermitien pré- 
cédemment défini. Lorsque tf(x) = jc a 
et que h(s) = y.Y + 5, aVGC y ^ 0, les 
conditions p > 0 et v < 0 sont équivalen- 
tes aux conditions y < 0 et ya + 5 > 0. 
De plus, 

r(x) = (x- a y- l e yx 

est une résolvante de x. Le système (P ;; ) de 
polynômes orthogonaux associé au poids r 
est une base hilbertienne de E constituée de 
fonctions propres de U ; plus précisément : 

U(P„) = »yP„; 

les polynômes P A? s’appellent polynômes de 
Sonine ; dans le cas où p = 1, on trouve les 
polynômes de Laguerre. 

Examinons enfin le cas où I — R ; on 
suppose que les fonctions a et b, ainsi que 
toutes leurs dérivées, sont des éléments de 
l’espace vectoriel E des fonctions à crois- 
sance lente au voisinage de ± x, et on 
considère U comme un endomorphisme 
de E ; on suppose de plus que b(x) / æ(x) 
admet des limites p > 0 et v < 0, finies ou 
infinies, lorsque x tend vers — x et vers 
+ x. La théorie se poursuit alors comme 
dans les cas précédents. Lorsqu’on a : 

a(*)=l, b(x) = y*+ô, ô^O, 

les conditions p > 0 et v < 0 sont équi- 
valentes à la condition y < 0. De plus : 



est une résolvante. Le système (p„) des 
polynômes orthogonaux associé au poids r 
est encore une base hilbertienne de E 
constituée de fonctions propres de U ; plus 
précisément : 

U(P„) = 

les polynômes s’appellent alors polynô- 
mes d’Hermite. 


Fonctions génératrices 
des polynômes orthogonaux 

Les polynômes orthogonaux P, 2 précédem- 
ment introduits peuvent se calculer de la 
manière suivante : de la relation (ru)’ = rb, 
on déduit, par récurrence sur que : 

D '{ra») = rQ n , 

où est une fonction polynomiale de 
degré n . Par intégrations par parties, on 
prouve que, pour tout entier est 

proportionnel à P rt : c’est la formule de 
Rodrigues. De plus, la résolvante r peut se 
prolonger en une fonction holomorphe sur 
C {a, P). La formule intégrale de Cau- 
chy permet alors d’établir la formule de 
Schlaffli : 


'•(z)Q*(z) = 


P r (CMC)" 

J r (C — z )" + 1 


rfc, 


où z G C — {a, p} et où T est un cercle 
d’indice 0 par rapport à a et p. On en 
déduit le résultat suivant (fonction géné- 
ratrice des polynômes orthogonaux). 

Soit X un point de I, et p un nombre réel 
strictement positif tel que le cercle T de 
centre X et de rayon p soit d’indice 0 par 
rapport à a et p. Pour tout nombre 

complexe u tel que u SUp a(Q < p, 
ter 


+ °° 

i 

n = 0 


Qn(x) 

ni 


u n 


rj?) _ 1 , 

r(x) 1 — ua'(w) 


où W est le seul élément du disque ouvert 
de centre x et de rayon p tel que : 


w-x ~-ua(w) = 0. 


Dans le cas des polynômes de Legendre 
réduits, c’est-à-dire le cas où a{x) = x 2 — 1 
et où h(x) = 2 x, on peut prendre r = 1 ; 
le polynôme Q„ satisfait alors à l’équation 
différentielle : 


(x 2 — 1 )y” + 2 xy' + 1)^ = 0 ; 
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d'où : 

Q„(x) = D"[(x 2 — 1) B ], 

et : 


I 9 *?--. 


! \u l — 4 xu + 1 


lorsque | u < 1/6, cette strie converge 
uniformément sur [- 1, 1]. 

De même, la fonction génératrice des 
polynômes de Laguerre réduits, c’est-à- 
dire dans le cas où a(x) — X et où 
b(x) = 1 — A', est : 


CO 



n= 0 


Enfin, la fonction génératrice des poly- 
nômes d’Hermite réduits, c’est-à-dire dans 
le cas où a(A') = 1 et b(x) = 2a, est : 

+- « 

Z O ûc> 

= = exp ( — u 2 + 2 ux). 

n = 0 
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POLYNÔMES 

L a théorie des équations et des polynô- 
mes a i-té le propos essentiel de l’algè- 
bre jusqu’au XIX e siècle (cf. ÉQUATIONS 
algébriques, algÈbre) et est à la base de 
la théorie des corps et de la théorie des 
nombres algébriques. Nous nous sommes 
limités ici à une construction formelle des 
objets mathématiques considérés, qui fait 
apparaître, sous le vocable « polynômes », 
l’existence de deux notions distinctes : les 
polynômes formels et les fonctions poly- 
nomiales. Cet article élémentaire pourra 
aussi servir d’introduction au maniement 
des notations abstraites. 
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Polynômes formels 

La notion de polynôme est familière, mais 
on s’est contenté pendant fort longtemps 
de décrire des règles de calcul sans définir 
véritablement les objets mathématiques 
considérés. On trouve couramment des 
définitions comme : « Un monôme entier 
en la variable x est une expression de la 
forme Ax”, A étant un coefficient numéri- 
que et n un entier positif » ; « Un polynôme 
en la variable x est une somme qui ne peut 
être composée (sic) que de nombres et de 
monômes entiers ». Puis suit l’énuméra- 
tion des règles de calcul sur ces objets. 

La construction des polynômes donnée 
ici illustre, dans le cadre simple de l’algèbre 
élémentaire, la manière dont le mathéma- 
ticien formalise, en suivant une voie qui 
peut sembler a priori déroutante, voire 
artificielle, certaines notions tenues pour 
« évidentes » ou « intuitives ». 

Définition 

Soit A un anneau commutatif unitaire (cf. 
ANNEAUX ET ALGÈBRES). On appelle poly- 
nôme à une indéterminée (cette termino- 
logie sera justifiée plus loin) à coefficients 
dans A toute suite : 

P = (a 0t a u a 2 , a„ . ..) 

d’élément de A nuis sauf au plus un 
nombre fini d’entre eux (c’est-à-dire tous 
nuis à partir d’un certain rang). Les 
éléments a ,• sont les coefficients du poly- 
nôme P. 

Les polynômes étant définis comme des 
cas particuliers de suites (c’est-à-dire 
d’applications de l’ensemble N des entiers 
naturels dans A), deux tels polynômes sont 
donc égaux si et seulement s’ils ont les 
mêmes coefficients. 


Anneau des polynômes 
Nous allons maintenant définir formelle- 
ment l’addition et la multiplication. Soit : 

P= (<*o>°i a,,...). 

Q = ..> b„, ...)> 

deux polynômes à coefficients dans A. On 
appelle somme et produit de P et Q 
respectivement les polynômes : 

(1) P + Q =( û o + a \ + ài, . . . . 

a , + b n , . ••) 
et : 

(2) PQ = (c„,c„...,c„,...). 

avec : 

Cq = a Q bQ,Ci = û 0 ^i+ a x b Qy . . . . 

c n = aç)b n + ci\b n _ i + + a n b 0 . 

Il est facile de vérifier que l’ensemble 
des polynômes considérés est ainsi muni 
d’une structure d’anneau commutatif uni- 
taire ; nous désignerons provisoirement 
cet anneau par L. On va montrer qu’on 
peut « identifier » A à un sous-anneau de 
l’anneau L en remarquant pour cela que 
l’application : 

a ' — ► (tz, 0, 0, 0, . ..) 

est un isomorphisme d’anneau de A sur le 
sous-anneau A’ de L formé des polynômes 
dont tous les coefficients de rang ^ 2 sont 
nuis. Il est donc équivalent de « calculer » 
dans A ou de faire ces calculs sur les 
éléments correspondants de A’, et nous 
identifierons ces deux anneaux en utilisant 
l’écriture abrégée : 

a = (a, 0, .... 0, . 

pour tout a G A. Pour cette raison, les 
éléments de A’ sont appelés des constantes , 
ou des polynômes constants . 

Remarquons que, si a est un polynôme 
constant et P un polynôme quelconque, la 
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multiplication de P par a revient à multiplier 
tous les coefficients de P par a. Dans le cas 
où A est un corps, cette « multiplication sca- 
laire » ( a , P) i—* aP munit l’anneau des poly- 
nômes à coefficients dans A d’une structure 
d’algèbre commutative sur le corps A. 

Notion d’indéterminée 
Désignons par X le polynôme : 

x = (0, 1, 0,....0, ...), 

dont tous les coefficients sont nuis, sauf le 
second coefficient, qui est égal à l’élément 
1 de l’anneau A. Il résulte de la définition 

(2) de la multiplication que l’on a : 

X 2 = (0, 0, 1, 0, .... 0, . ..)• 

X 3 = (0, 0, 0, 1, 0, .... 0, . ..) 

et, plus généralement, pour tout entier 
n > 0, 

où bjj est le symbole de Kronecker (égal à 
1 si i — j et à 0 si i j). Si on a: 

P=(a 0 , a 

avec (l p = 0 pour p > n et a n 7^ 0, on 
obtient donc, en appliquant les définitions : 

(3) P = Ü 0 + a{X + a 2 X 2 + + a n X n 

n 

= a„ # 0 . 

1 = 0 

Le nombre n qui figure dans la formule 
( 3 ) s’appelle le degré du polynôme P, noté 
d”(P) ; tout polynôme différent du poly- 
nôme nul a un degré bien déterminé, et 
l’écriture ( 3 ), appelée développement de P 
suivant les puissances croissantes, est uni- 
que. L’anneau des polynômes étant com- 
mutatif, on pourrait tout aussi bien 
« ordonner P suivant les puissances 
décroissantes » en écrivant : 

P = a n X n + + a{X + a 0i a, 7^ 0. 


Pour éviter des cas d’exception, on pose 
souvent d°(0) = 00 , symbole formel régi 

par les conventions suivantes : pour tout 
entier naturel n, on pose — 00 < n et 
n + (- 00) = - » ; (- 00) + (- oc) = 

— 00. On peut alors énoncer, quels que 
soient les polynômes P et Q, des résultats 
tels que : 

d°(P + Q)< sup(d°(P), d°(Q», 
avec égalité si d”(P) 7E d°(Q), et : 
d°(PQ) < d°(P) + d°(Q), 

avec égalité si A est un anneau intègre. 

La notation ( 3 ) justifie la terminologie 
de polynôme « à une indéterminée » et la 
notation A[X] que l’on utilise pour désigner 
l’anneau des polynômes à une indéterminée 
à coefficients dans A. Il est clair que la lettre 
X que l’on utilise pour désigner le poly- 
nôme (0, 1, 0, . ..) est arbitraire, en ce sens 
que, si, dans un texte mathématique, les 
lettres X et Y sont « disponibles », c’est-à- 
dire si elles n’ont pas encore été employées 
précédemment, on a A[X] = AM. 

La construction formelle est mainte- 
nant terminée et les polynômes sont com- 
plètement définis. Il nous suffit de retenir 
que ce sont des objets mathématiques qui 
s’écrivent de manière unique sous la forme 
( 3 ) et qui obéissent aux règles usuelles de 
calcul dans un anneau. 

Remarquons pour terminer que, si A 
est un corps, 

l,x,X 2 X" 

est une base de l’espace vectoriel (sur A) 
des polynômes de dimension ^ n , espace 
qui est donc de dimension n + 1. 

Dérivation formelle 

L’examen des règles classiques de dériva- 
tion des fonctions numériques conduit à 
une approche formelle de la dérivation 
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dans un anneau. On appelle dérivation 
d‘un anneau commutatif unitaire B une 
application : 


d’après les règles de calcul dans l’anneau 
C, tout polynôme non nul de C s’écrit donc 
de manière unique sous la forme : 


D : B - B 

telle que. quels que soient P et Q (E B,onait: 

(4) D(P + Q) = D(P) + D(Q), 

(5) D(PQ) = D(P)Q + PD(Q). 

On s’intéressera ici à l’unique dériva- 
tion de B = A[X] telle que : 

D(x) = î, D(a) = o, 

pour tout polynôme constant 6= A. Si 
P = a, + a, X -}- M1 + a n X'\ il résulte 
immédiatement des conditions (4) et (5) 
que l’on a : 

D(P) = a, + 2 a 2 X + + m n X n ~ x \ 

on note souvent D(P) = P’. Par récur- 
rence, on alors la définition : 

P” = D 2 (P), P<*>=D*(P) 

Polynômes à plusieurs indéterminées 

Si A est un anneau commutatif unitaire, il 
en est de même de l’anneau B = A[X] des 
polynômes à une indéterminée à coeffi- 
cients dans A. On peut donc considérer 
l’anneau C des polynômes à une indéter- 
minée à coefficients dans B, soit : 

C = B [Y] = (A[X])[Y] ; 

il faut employer une autre lettre, Y, car X 
a déjà été utilisé. L’anneau B s’identifie à 
un sous-anneau de C et tout élément non 
nul de C s’écrit de manière unique : 

g 

PjYJ, P, =* 0, 

1 = » 

OÙ P, 6 A[X], soit : 



1 = 0 


(6) 11 aij X‘Yi,a„*0 


La symétrie qui apparaît dans cette 
formule suggère la notation symétrique 
C = A[X,Y] pour désigner l’anneau des 
polynômes à deux indéterminées à coeffi- 
cients dans A. On définit de la manière 
usuelle le degré total d’un tel polynôme, 
égal à p + q si le polynôme est sous la 
forme (6), les degrés partiels en X et en Y, 
égaux respectivement à p et y dans (6), et 
les dérivations partielles formelles. 

La construction précédente s’étend 
sans difficulté par récurrence pour définir 
l’anneau A[X,, . . . . X„] des polynômes à n 
variables à coefficients dans A. 

Si A est un anneau d’intégrité, les 
anneaux de polynômes A[Xj, .... X,] sont 
des anneaux d’intégrité. Dans le cas par- 
ticulier où A — K est un corps commuta- 
tif, le corps des fractions (cf. anneaux 
commutatifs, chap. 1, et CORPS, châp. 2) 
de l’anneau K[X b .... X,] est le corps des 
fractions rationnelles à n variables à coef- 
ficients dans K ; on le note traditionnelle- 
ment K(X b .... X,). 


Division euclidienne 

Nous supposerons dans ce qui suit que 
A = K est un corps commutatif. L’anneau 
K[X] possède alors des propriétés arith- 
métiques très voisines de celles de l’anneau 
Z des entiers relatifs. Cela traduit le fait 
que l’un et l’autre sont des anneaux prin- 
cipaux et on peut dire que cette notion 
unificatrice d’anneau principal est née 
essentiellement de la répétition parfaite, 
pour l’anneau K[X], de toutes les consi- 
dérations de divisibilité valables dans Z 
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(Cf. anneaux commutatifs, chap. 2). un élément de A[X] écrit sous la forme (3). 

Comme pour Z, la démonstration du fait On appelle valeur de P sur un élément 

que tout idéal est principal repose sur x G A l’élément : 

l’existence d’une division euclidienne : Si A 

n 

et B G K[X], il existe des polynômes Q et (8) P(x ) _ V a . xl ^ A> 

R déterminés de manière unique tels que : 


(7) A = BQ + R, d°(R) < d°(B) ; 

le cas R = 0 exprime que A est un multiple 
de B. On voit ici l’intérêt de la convention 
d°(0) = — oo } qui nous évite un cas 
d’exception. 

Soit 1 un idéal de K[X]. Nous pouvons 
supposer [ zfz {0} et nous choisissons dans 
I un polynôme B ^ 0 de degré minimum. 
Soit A G 1 ; la division euclidienne (7) de 
A par B entraîne que R — A — BQ appar- 
tient à I puisque I est un idéal qui contient 
A et B. L’inégalité d°(R) < d°(B) entraîne 
R = 0 puisque B est de degré minimum 
parmi les polynômes zfz 0. Ainsi l’idéal I 
est formé des multiples du polynôme B et 
est donc principal. 

La structure arithmétique des anneaux 
de polynômes à plusieurs indéterminées 
est plus compliquée et nous renvoyons à 

l’article ANNEAUX COMMUTATIFS pOUT deS 

indications sur ce sujet. 

Fonctions polynomiales 
À l’exception de tout ce qui concerne les 
racines, les résultats qui seront énoncés 
dans le présent chapitre s’étendent facile- 
ment au cas des polynômes à plusieurs 
indéterminées ; nous nous contenterons de 
les énoncer pour les polynômes à une 
indéterminée. 

Fonction polynomiale 
associée a un polynôme formel 
Soit A un anneau commutatif unitaire et : 

-Z-* 


et fonction polynomiale associée à P 
l’application P* : A — ► A définie par 
P*(x) = P(s) ; dans la pratique, on dési- 
gne encore par P cette fonction polyno- 
miale. 

Les fonctions polynomiales, c’est-à-dire 
les applications de A dans A pouvant 
s’obtenir à partir des éléments de A[X], 
forment un anneau commutatif unitaire, 
et l’application de K[X] dans cet anneau 
qui à tout polynôme formel associe la 
fonction polynomiale correspondante est 
un homomorphisme (par définition sur- 
jectif) d’anneaux. Si A est un anneau 
d’intégrité infini, cet homomorphisme 
est en fait un isomorphisme , c’est-à- 
dire que deux polynômes P et Q G A[X] 
sont égaux si et seulement si P(x) = Q(x) 
pour tout x G A. Pour obtenir un contre- 
exemple, il suffit de prendre pour A 
le corps fini {0, 1, 2} des classes 
d’entiers modulo 3 ; le polynôme non 
nul : 

2X — 3X2 + X 3 = x ( X - 1)(X — 2) 
prend la valeur 0 en tout point de A. 

Remarque 

Soit L un sur-anneau de l’anneau A. La 
formule (8) permet de définir P(x) pour 
tout A" C L et de définir ainsi une applica- 
tion polynomiale, dite encore associée à P, 
de L dans L. Cette remarque va nous 
permettre de préciser un point de notation. 
Prenons poui i2ic’ sur-anneau A[X] , s i 
Q G A[X], la notation P(Q) désigne un 
élément de A[X] qui s’obtient en « substi- 
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tuant Q à X » et en développant les 
puissances de Q obtenues, en tenant 
compte des règles de calcul dans A[X]. Si 
on prend, en particulier, Q = X, on 
obtient le polynôme P lui-même, soit 
P(X) = P, ce qui nous permet d’utiliser 
indifféremment, pour désigner un poly- 
nôme, la notation P ou la notation P(X). 

Prenant l’anneau A[X, Y] des polynô- 
mes à deux indéterminées pour sur- 
anneau, on peut donc définir 
P(X + Y) £ A[X, Y] pour tout P E K[X]. 
La « formule de Taylor » s’écrit ici, si P est 
de degré 

P(X + Y) = P(X) + P'(X)Y + I P"(X)Y 2 

+ + 1 P<”)(X)Y" 

n ! 

où les dérivations qui figurent sont les 
dérivées formelles définies au chapi- 
tre 1. 

Racines 

Soit P E A[X] et a un élément de A. La 
division euclidienne de P par X-a 
s’écrit : 

P = (X - — û )Q + R, 

avec d°(R) < d°(X -a) = 1 ; donc R est 
un polynôme constant. Prenant les valeurs 
des deux membres en a, on a P(a) = R, 
d’où l’égalité : 

(9) P = (X — a)Q + P(a). 

On dit que l’élément a E A est une 
racine du polynôme P si P(a) — 0. D’après 
(9), cela équivaut à avoir P divisible par le 
polynôme du premier degré X-u. On 
appelle ordre de mulplidté de la racine a le 
plus grand entier h tel que (X d) h divise 
P ; ainsi, dire que a est racine d’ordre k 
du polynôme P équivaut à affirmer : 


P = (X — a) k Q, l’élément a n’étant pas 
racine du polynôme Q. 

Nous renvoyons aux articles Corps et 
Équations aLgÉbriques pour une étude 
détaillée des racines dans le cas où A est un 
corps commutatif. Terminons sur un résul- 
tat valable pour les anneaux d’intégrité : Si 
A est un anneau d’intégrité (unitaire) et si 
P 6 A[X] est de degré ^ n, P ^ 0, la 
somme des ordres de multiplicité de P dans 
A est ^ n. Il en résulte que, si P et 
Q E A[X] sont tous deux de degré ^ n et 
prennent des valeurs égales sur n + 1 
éléments de A, alors P = Q. 

Si K est un corps, on en déduit qu’il 
existe un polynôme de degré n et un seul 
prenant des valeurs données b t E K sur ri 
éléments distincts donnés ü t E K, 
i= 1, . . . . n. On doit à Lagrange son 
expression sous la forme : 

n 

P(X) = J> R,(X), 

où R,(X) est le polynôme : 

(X fl i) — (X — — i)(X — a i + j) ... (X — a n ) 
{üj — a {) ... {a i — a i _ x ){a i ^a i+x ) ... (a,--a,)’ 

nous renvoyons à l’article représentation et 
approximation des fonctions pour plus de 
précisions sur l’interpolation polynomiale. 
Remarquons que R,(X) est l’unique poly- 
nôme de degré n tel que : 

= §ip 

où bjj est le symbole de Kronecker. 

JEAN-LUC VERLEY 
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POTENTIEL & FONCTIONS 
HARMONIQUES 


L a théorie du potentiel, directement 
issue de l’électrostatique, est une 
source d’inspiration extrêmement riche en 
analyse. Si, au début du XIX e siècle, on 
connaissait déjà l’équation de Laplace, la 
fonction de Green et l’intégrale de Poisson 
dans la boule, ce n’est vraiment qu’avec 
C. F. Gauss (1840) que sont posés et 
résolus, bien qu’ imparfaitement, les 
grands problèmes de la théorie. Les idées 
de ce dernier sont si exemplaires qu’elles 
sont encore utilisées à l’heure actuelle, et il 
fallut attendre Frostman (1935) pour que 
le travail de Gauss fût amélioré en préci- 
sion et en rigueur par l’introduction des 
outils nouveaux que s’était entre-temps 
forgés l’analyse. 

On commencera par exposer les élé- 
ments fondamentaux qui permettront 
d’énoncer les problèmes et les principes les 
plus importants et les plus spécifiques de la 
théorie du potentiel : théorèmes de conver- 
gence. principe de domination, problème 
du balayage (cela afin d’arriver de la façon 
la plus directe à des résultats suffisamment 
précis). On se limitera ainsi au cas d’un 
ouvert borné, et on omettra de parler de 
« topologie fine » et de tout un chapitre de 
la théorie fine du potentiel. On ne pourra 


pas, non plus, parler des théories plus 
spéciales, comme par exemple la théorie 
très importante des potentiels besséliens 
d’Aronszajn et Smith. On envisagera 
quelques-unes des théories axiomatiques 
ou dérivées, issues de la théorie du poten- 
tiel, en mettant l’accent sur le lien avec la 
théorie des probabilités et celle des équa- 
tions aux dérivées partielles : c’est là un 
centre de recherche important. 

Le sujet est immense et la théorie du 
potentiel occupe une position centrale en 
analyse. En étudiant Fexistence d’une 
solution du problème de Dirichlet, I. Fred- 
holm considéra l’équation intégrale qui 
porte son nom ; c’est aussi à l’occasion de 
l’étude d’un critère de polyharmonicité 
que Laurent Schwartz a été amené à 
définir les distributions. Les problèmes de 
Dirichlet et de Neumann sont également 
des problèmes fondamentaux de la théorie 
des équations aux dérivées partielles. 
Enfin, la théorie de la capacité peut être 
considérée comme un chapitre important 
de la théorie de la mesure (ou vice versa), 
et le théorème de représentation intégrale 
de Choquet est tout aussi surprenant par 
sa simplicité que par sa profondeur et son 
efficacité. 

& 


1. Fonctions surharmoniques 
et potentiels 

Pour tout ensemble A de R", on note dA 
sa frontière topologique et A son adhé- 
rence. B(x, r) désigne une boule ouverte de 
centre x et de rayon y. 

La mesure de Lebesgue est notée dx et 
on entend par fonction réelle une fonction 
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à valeurs réelles prenant éventuellement les 
valeurs + oo et oo. 

Fonctions surharmoniques 
et harmoniques 

Une fonction réelle u définie dans un 
ouvert (u de R”, n ^ 2, est dite hyper- 
harmonique si elle est semi-continue infé- 
rieurement et > — oo, et si, pour tout iE(i) 
et pour toute boule B = B(x, r), B C g), 
on a : 

où do désigne la mesure superficielle de la 
boule et o(B) l’aire de la boule B. On 
exprime cette dernière condition en 
disant que u majore sa moyenne sur toute 
boule. 

De manière analogue, u est dite hypo - 
harmonique si elle est semi-continue supé- 
rieurement et < + oo et si, avec les nota- 
tions précédentes, 

M( *> < 

pour B C (0. 

Le module ou le logarithme du module 
d’une fonction holomorphe de la variable 
complexe Z est hypoharmonique. 

On dit qu’une fonctionf 4 définie dans un 
ouvert 0) de R" vérifie le « principe du 
minimum » si, pour tout ouvert 5, avec 
Ô compact C co, la condition : 

lim inf f (y)è A, 

y^x 

pour tout x G dô, entraîne f ^ X dans 5. 

Propriétés 

des fonctions hyperharmoniques 

1. Dans un ouvert g>, une fonction hyper- 
harmonique ne peut atteindre un mini- 
mum en un point de G) sans être constante 


au voisinage. Cela entraîne que les fonc- 
tions hyperharmoniques dans un ouvert 
vérifient le principe du minimum. 

2. L’ensemble des fonctions hyperharmo- 
niques forme un cône convexe qui est 
stable par enveloppe inférieure finie. 

3. L’enveloppe supérieure d’un ensemble 
filtrant croissant de fonctions hyperharmo- 
niques est hyperharmonique. 

4. Dans un domaine G) C R", une fonction 
hyperharmonique finie en un point est finie 
presque partout. Elle est alors dite sur har- 
monique. 

5. Une fonction localement surharmoni- 
que est surharmonique. 

6. Si s est surharmonique dans un ouvert 
G) C R", pour tout p et tout compact 
K C G), il existe une suite croissante de 
fonctions surharmoniques p fois continû- 
ment différentiables dans un ouvert 5 
contenant K, telle que : 

s(x)= sup5 n (x), 
pour tout lEô. 

Les propriétés 2, 3 et 4 sont évidentes. 
Les propriétés 1, 5 et 6, plus difficiles, sont 
fondamentales. 

Une fonction u telle que — u soit 
surharmonique est dite sous-harmo- 
nique. Si u est surharmonique et SOUS- 
harmonique, elle est dite harmonique. Elle 
est donc finie, continue et égale à sa 
moyenne en tout point. 

Propriétés des fonctions harmoniques 

1. Une fonction harmonique u dans un 
ouvert G) C R" ne peut avoir un maximum 
ou un minimum en un point de g) sans être 
constante au voisinage. 

2. Les fonctions harmoniques sont indé- 
finiment dérivables. 

Il suffit pour le voir de faire le produit 
de convolution de u harmonique dans un 
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ouvert 0) avec la fonction indéfiniment 
dérivable (p définie par : 

k £X P ,2 _2 ’ 0 < r < r 0> 

r r o 

0, r ^ ro, 

r = | JC t 0 | pour B(f 0 , r 0 ) C co, la cons- 
tante k Etant choisie de telle sorte que : 



En écrivant u sous le signe J en fonction 
de sa valeur moyenne et en intervertissant 
l’ordre des intégrations, on vérifie que la 
fonction cp * w, définie par : 

qp * u (t ) = cp(r — x)u (x ) dx , 

est indéfiniment dérivable en / 0 , et vaut 
ü( t ) au voisinage de t 0 . 

3. Une fonction u est harmonique dans q) 
si et seulement si, pour toute boule 
B C B C CO, on a, en désignant par du/dn la 
dérivée normale de u sur dB. 



Ainsi, la partie réelle d’une fonction 
holomorphe est harmonique (cf. fonc- 
tions analytiques Fonctions analyti- 
ques d’une variable complexe, chap. 3). 

5. Une fonction harmonique est analyti- 
que. 

6. Dans le plan, l’inversion et les trans- 
formations conformes conservent rharmo 
nicité. Dans R", n ^ 3, l’inversion ne 
conserve pas l’harmonicité : si une inver- 
sion I Y de centre Aq transforme x en x\ u 
harmonique se transforme en V tel que 
V(-v') = u(x), alors : 


est harmonique. La fonction h s’appelle la 
transformée de Kelvin de il. 

La transformation de Kelvin (inversion 
dans le plan) conserve également la surhar- 
monicité. Ajoutons aussi qu’une fonction 
S surharmonique vérifie As ^ 0 au sens 
des distributions. Cela se voit facilement 
pour s de classe C 2 à l’aide d’un dévelop- 
pement limité à l’ordre 2. On passe au cas 
général en utilisant une suite croissante 
d’après la propriété 6 des fonctions surhar- 
moniques. 


ce qu’on exprime en disant que le flux 
sortant est nul. 

En effet, si u est harmonique, la 
moyenne de u sur B(/ 0 , y) ne dépend pas de 
r et, en dérivant sous le signe J, on obtient 
(1). Inversement, l’intégration de (1) en Y 
montre que u vaut sa moyenne. 

4. Une fonction u est harmonique si et 
seulement si elle vérifie Au = ü où A 
désigne le laplacien. 

Cela résulte immédiatement de la for- 
mule de Green : 



Potentiel newtonien et logarithmique 
En écrivant le laplacien en coordonnées 
polaires et en cherchant des solutions de 
Au = 0 qui ne sont fonction que de la 
distance r à l’origine, on trouve les fonc- 
tions : 

a ln r + b , 

pour n = 2, et les fonctions : 



pour n ^ 3, a et b étant des constantes 
arbitraires, 
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On introduit alors la fonction harmo- 
nique fondamentale h(r). Dans le plan : 

h(r) = ln - 
r 

s’appelle noyau logarithmique. Dans 
l’espace R”, n ^ 3, 

1 

h(r) = 

est le noyau newtonien. La fonction h est 
surharmonique et harmonique en dehors 
de l’origine. 

Si p est une mesure à support compact 
(par exemple), la fonction : 

Uf(*) =jh(x-y)d l i(y) 

s’appelle potentiel logarithmique ou newto- 
nien selon que l’on se place dans le plan ou 
l’espace. On parlera aussi de potentiel 
classique si l’on ne veut pas préciser : il 
faut noter que ce potentiel n’est pas 
partout défini. En pensant à une charge 
électrique répartie (par exemple continû- 
ment) avec une densité p sur une surface 
I, on a : 

Up(x) = J h(x— y)p(y)do(y), 

où do représente la mesure d’aire de la 
surface. C’est pourquoi on utilise un lan- 
gage imagé en disant que la mesure p 
représente la charge ou les masses du 
potentiel. Par dérivation sous le signe 
somme, on vérifie facilement que U M est 
harmonique en dehors du support de p. Il 
faut aussi savoir que, si p est positive, U M 
est surharmonique. 

II y a une différence essentielle entre le 
cas du plan et celui de l’espace, qui 
provient de la différence de comportement 
des noyaux à l’infini : toute fonction 
surharmonique positive dans R 2 tout 
entier est constante. 


Intégrale de Poisson 
et problème de Dirichlet 
La formule de Poisson dans la boule 
B = B(0, R) : 

où (X n désigne l’aire de la boule de rayon 1, 
peut s’obtenir de diverses manières. La 
plus simple consiste à utiliser la transfor- 
mation de Kelvin de la façon suivante : Si 
x' désigne l’inverse de dans l’inversion de 
centre 0 et de puissance R 2 , on effectue la 
transformation de Kelvin de centre x qui 
transforme x en 0 et qui conserve 
dB(0, R). La fonction u(y) devient alors 
h (y), et on écrit que la valeur en 0 est la 
moyenne de h sur dB. En transformant 
cette intégrale sur h en intégrale relative à 
w, on obtient la relation cherchée. 

La formule de Poisson permet de résou- 
dre le problème de Dirichlet dans le cas de 
la boule : Sifest une fonction donnée finie 
continue sur dB, alors I® est un prolonge- 
ment continu de f dans B, harmonique 
dans B. 


Inégalités de Harnack 

et familles de fonctions harmoniques 

Une majoration suivie d’une minoration 
de (3) donne, pour U > 0 harmo- 

nique dans B(0, R), les deux formules 
suivantes : 


(4) R* 


2 R — |a: — < u ( x ) 

R + \x — y \ n ~ 1 ^ uiy) 

< R + 1*-.H p » — 2 

^ R — \x — y \ n ~ 1 


(5) |gradtt| 0 < ^«(O). 


On en déduit immédiatement : 

Théorème 1 : Toute famille T locale- 
ment bornée de fonctions harmoniques 
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dans un ouvert g) est équicontinue en tout 
point de G). 

Corollaire 2 (Ascoli) \ La convergence 
simple d’une suite { u n } localement bornée 
entraîne la convergence uniforme locale 
vers une fonction harmonique. Si G) est 
connexe, il suffit, grâce à l’analyticité, que 
{ u n } converge simplement au voisinage 
d’un point. 

De toute suite {u tJ } on peut extraire une 
suite { u np } convergeant uniformé- 
ment localement vers une fonction harmo- 
nique. 

L’inégalité (5) montre encore que la 
convergence uniforme locale de u entraîne 
celle des dérivées successives. 

En partant de (4) ou du théorème 
précédent, on peut montrer facilement les 
deux propriétés suivantes, d’ailleurs équi- 
valentes dans un domaine G) : 
a) Pour tout K compact inclus dans cd, il 
existe une constante k > 0 dépendant 
seulement de K et de G) telle que, pour 
toute fonction harmonique u > 0 dans G), 
on ait les inégalités de Harnack : 


1 u(x) < 


quels que soient X, y £ K 
b) Pour toute famille (u,) filtrante crois- 
sante de fonctions harmoniques dans G), si 
sup u t est finie en un point, sup u t est finie 
et harmonique dans Gl). 

L’équicontinuité jointe à l’inégalité de 
Harnack permet d’énoncer que toute 
famille (u,) de fonctions harmoniques, 
localement bornée inférieurement dans un 
domaine, forme une famille normale de 
Monte 1 ; autrement dit : de toute suite 


(u,,) C (Uj) on peut extraire une suite 


v v i ô Uu VCiS 


tion harmonique (uniformément locale- 
ment). 


Théorème de représentation de Riesz 
Soit y un point de B(x 0 , R). On appelle 
fonction de Green ou bien noyau de Green 
de la boule B(Xq, R) relative au pôle y la 
fonction : 

a* = *, — io,). 

OÙ I (hf) est l’intégrale de Poisson dans B 
de la restriction de h v à dB. 

Si y, est l’inverse de y dans l’inversion 
de centre x 0 qui conserve dB, on a expli- 
citement : 

La fonction G v , surharmonique posi- 
tive dans B, est harmonique en dehors de 
y, s’annule sur dB et vérifie la propriété de 
symétrie G v (x) = G v (y). 

On définirait plus généralement la fonc- 
tion de Green d’un ouvert borné G) en 
posant : 

Gy = h y~ . 

où H w /( désigne la solution généralisée du 
problème de Dirichlet avec pour donnée 
frontière la trace de h v sur dis). La seule 
différence provient de ce que G> ne 
s’annule pas partout à la frontière. 

Si p est une mesure positive, la fonc- 
tion : 

est appelée potentiel de Green, potentiel 
pur ou simplement potentiel. C’est une 
fonction hyperharmonique positive dans 
G), 

Si le potentiel U M est deux fois continû- 
ment différentiable et p = p dx, avec p 
continue, on obtient, à l’aide de la formule 
de Green, l’équation de Poisson : 

AU** = — cp„p, 
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où cp est un coefficient numérique dépen- 
dant de n. 

Plus généralement, si T est une distri- 
bution à support compact, U T se définit 
encore comme la distribution h * T, et on 
a encore au sens des distributions : 

A U = = — cp„ T 

L’équation de Poisson permet de 
connaître la charge quand on connaît le 
potentiel et permet de démontrer le théo- 
rème suivant. 

Théorème 3 (théorème de représentation 
de Rie Si) : Si V, surharmonique dans un 
ouvert borné (0, admet une minorante 
harmonique dans eu, on a : 

V(x) =Jo;(^)rfu{v) + v*(x), 

où V* est la plus grande minorante har- 
monique de V et p la mesure positive 

AV/cp,. 

L’existence d’une plus grande mino- 
rante harmonique résulte de la proposition 
suivante. 

Proposition 4 : Si 3 est la famille des 
fonctions sous-harmoniques minorant la 
fonction surharmonique V, alors 
h = sup 3 est harmonique. 

La fonction h est alors la plus grande 
minorante harmonique de V. Cela se 
démontre en utilisant le fait que l’on peut 
remplacer s sous -harmonique dans 0) par la 
fonction s' égale à I® dans la boule 
B C B C G) et égale à s ailleurs. De ce fait, 
s' ^ s , et s' est encore sous-harmonique. 
On remarque que ,T est filtrante crois- 
sante. Si T' désigne la famille des fonctions 
s’ quand s parcourt 3 pour B donné, on 
voit que sup T = sup 3’ est harmonique 
dans B (théorème de convergence pour les 
fonctions harmoniques) ; B étant arbi- 
traire, h est harmonique (critère local). 


Notons qu’un potentiel est donc carac- 
térisé comme une fonction surharmonique 
positive dont la plus grande minorante 
harmonique est nulle. 


2. Théorèmes et principes 
fondamentaux 

Balayage 

On appelle S-fonction une fonction u 
localement bornée inférieurement qui véri- 
fie, pour toute boule B( v, R), la relation : 

u(y) > f- u d o , jrGBÇ*), 
tf(B) J c?B 

où do est la mesure-aire de dB et J* 
l’intégrale supérieure. 

L’utilité de ces fonctions provient de ce 
que l’enveloppe inférieure d’une famille de 
S-fonctions localement bornée inférieure- 
ment est une S -fonction et que la régula- 
risée semi-continue inférieurement d’une 
S-fonction est hyperharmonique. 

Soit (o un ouvert borné de R’\ E C o), et 
cp une fonction ^ 0 sur E. On note (R E ) W 
ou R E l’enveloppe inférieure des fonctions 

V hyperharmoniques ^ 0 dans G) qui 
majorent cp sur E. La fonction R^ E 
s’appelle la réduite de cp sur E et est une 
S-fonction ; c’est une fonction croissante 
de E, positivement homogène et SOUS- 
additive en cp. 

La proposition 4 montre que R E est 
harmonique, ou égale à + oc, en dehors 
de E. 

Si cp est la trace d’une fonction surhar- 
monique v ^ 0, la régularisée R E , alors 
surharmonique, est appelée la balayée de 

V sur E. Si E est suffisamment régulier (une 
boule, par exemple), la balayée vaut y sur 
E ; et, si v est un potentiel G u , la balayée, 
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majorée par G^, est encore un potentiel qui 
vaut G m sur E. On peut donc écrire : 

= <v 

On dit que p E est la balayée de p sur E 
et que p E engendre le même potentiel que 
G m sur E. On dit de façon imagée que l’on 
a balayé les masses sur E. C’est en fait ce 
qui se passe : si E est toujours un compact 
suffisamment régulier, p E est alors consti- 
tuée des masses de p portées par E, 
auxquelles viennent s’ajouter les masses de 
p qui n’étaient pas portées par E. Une 
étude approfondie donne un résultat plus 
précis pour E quelconque. 

Principe de domination 
Plusieurs formes plus ou moins fortes du 
principe de domination peuvent être don- 
nées, dont celle-ci : Si, dans un ouvert w, 
une fonction surharmonique majore un 
potentiel G,, localement borne sur le 
support de p, elle le majore partout. Si G„ 
était continu, il ne s’agirait de rien d’autre 
que du principe du minimum. 

Capacité 

Soit K un compact d’un ouvert borné 0) de 
R”. On appelle potentiel capacitaire de K 
la balayée R | de 1 sur K. La mesure qui 
l’engendre s’appelle la mesure capacitaire 
et p(K) est la capacité de K, notée C(K). 
Grâce au principe de domination, on voit 
queRf est le plus grand potentiel majoré 
par 1 dans 0) ayant une masse associée ^ 0 
portée par K. Ce résultat donne la formule 
plus connue : 

C(K) = sup m(K), 

où la borne supérieure pour 

l’ensemble de toutes les mesures positives 
p portées par K telles que G M ^ 1 sur K. 


La capacité C est une fonction d’ensem- 
ble définie sur les compacts de (0 et telle 
que : 

1. La fonction C est une fonction crois- 

sante : 

C K 2 => e(Kj) ^ C(K 2 ) ; 

2. Si (K„) est une suite décroissante de 
compacts, d’intersection K ^ 0, on a : 

C(K) = lim e(K„); 

n • • 

on dit que C descend sur les compacts ; 

3. On a la propriété de sous-additivité 
forte. Pour tous compacts K, et K?, on a : 

C(Kj U K 2 ) + C(K, n K 2 ) < e(Kd + C(K 2 ). 

On définit aussi la capacité intérieure 
C* (E) et la capacité extérieure C*(E) d’un 
ensemble quelconque E par : 

P*(E) = sup C(K), 

où la borne supérieure est prise pour K 
parcourant l’ensemble des compacts 
contenus dans E, et : 

C*(E) = inf C*(o)), 

où la borne inférieure est prise pour (0 
parcourant l’ensemble des ouverts conte- 
nant E. 

On montre que, pour E relativement 
compact dans G), C*(E) est encore la masse 
totale de la mesure associée aRy. 

La fonction C* est croissante, descend 
sur les compacts et monte sur les ensem- 
bles quelconques ; cela signifie que, si (E„) 
est une suite croissante d’ensembles quel- 
conques. on a : 

C*(U E„) = sup C*(E„). 

n n 

Ensembles exceptionnels 

Il existe des ensembles de capacité stric- 
tement positive, qui sont très petits. Par 
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exemple, dans le plan, l’ensemble fermé de 
Cantor sur le segment [0, 1] est de capacité 
strictement positive alors qu’il est non 
seulement de mesure nulle (dans R 2 ), mais 
de mesure linéaire nulle. La capacité 
mesure donc de façon très fine la petitesse 
des ensembles. On verra qu’elle est par- 
faitement adaptée à la mesure des ensem- 
bles exceptionnels de la théorie du poten- 
tiel. 

On dit qu’une propriété est vraie 
quasi partout (on note en abrégé q.p.) si 
elle est vraie en dehors d’un ensemble 
de capacité extérieure nulle. Un ensemble 
P est dit polaire dans un ouvert borné 
s’il existe un potentiel G M fini en un point 
et infini sur P (contrairement aux 
apparences, cela ne dépend pas de o) 
borné). 

H. Cartan a montré qu’il y avait 
identité entre ensemble polaire et ensem- 
ble de capacité extérieure nulle dans un 
ouvert borné. Il a aussi démontré le 
théorème suivant, qui avait été obtenu 
précédemment par M. Brelot pour 
la capacité intérieure. Ce théorème est 
la clef de toutes les études fines de la 
théorie. 

Théorème 5 (théorème de Cartan- 
Brelot) : L’enveloppe inférieure d’une 
famille (v,) localement bornée inférieure- 
ment de fonctions surharmoniques dans 
un ouvert (0 de R” diffère de sa régula- 
risée semi-continue inférieurement d’un 
ensemble polaire. Cela permet de préciser 
pour un ensemble E quelconque que R*r, 
pour v surharmonique ^ 0, est égale q.p. 
à v sur E. 

Problème de Dirichlet généralisé 
et effilement 

Soit (0 un ouvert borné et f une donnée 
frontière (finie ou non). On considère la 


fa mill e <J> des fonctions hyperharmoniques 
V telles que : 

liminfv(;t) > /(y), 
x~~y 

x £ U 

pour tout y G do, cette limite inférieure 
étant > — x partout sur diù. On définit : 

ny = inf O, Hy = — H ( _ /} ; 
on a alors : 

H, ^ H/, 

et H/M est une fonction positivement 
homogène et sous-additive de f. Si on a 
Hy = H/ = Hy, on dit que f est résolutive 
et H, est alors la solution généralisée du 
problème de Dirichlet. Cette construction 
est due à Perron. Pour sa part, N. Wiener 
montra queffinie continue était résolutive 
et qu’ainsi f i— ► H^(x) définissait une 
mesure de Radon positive p“ appelée 
mesure harmonique. Brelot montra alors 
que pour qu’une fonction /, définie sur do, 
soit résolutive, il faut et il suffit qu’elle soit 
p£ intégrable ; cela ne dépend pas de 
XE O), 

Un point frontière Xq G do est dit régu- 
lier si, pour toutef ‘finie continue sur do, 
on a : 

lim H,(x) =f(x 0 ) ; 

X -*•*(, 

*É(i) 

si tout point frontière est régulier, on dit 
que (D est régulier. C’est le cas de la boule. 

On dit qu’un ensemble E est effilé en un 
point A'q G E si Xq n’est pas adhérent à E ou 
s’il existe une fonction surharmonique V au 
voisinage de E telle que : 

v(* 0 ) < lim inf v(x) ; 

X —"Xq 

x£E 

si x ô G E, on dit encore que E est effilé en 
Xq si E — {x 0 } est effilé en x 0 . 
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On montre alors qu’il existe un poten- 
tiel fini continu P dans 0) (ouvert borné) tel 
que, pour tout E C G), l’ensemble des 
points d’effilement de E coïncide avec 
l’ensemble des points x pour lesquels on a : 

Sfc*) < P(x). 

On en déduit, d’après le théorème 5, 
que l’ensemble des points de E, où E est 
effilé, est polaire (ou de capacité extérieure 
nulle). Si G) est un ouvert borné, on montre 
que Xq est régulier pour (o si et seulement 
si son complémentaire est non effilé en x. 

Il s’ensuit que l’ensemble des points 
irréguliers forme un ensemble polaire. 


Fonctions harmoniques positives 
et frontières de Martin 
Toute fonction harmonique positive U 
dans la boule B(0,R) s’écrit : 


“ (x)= ü 


R 2 — |*| 2 
\*-y\ n 


dv(y), 


où p est une certaine mesure > 0 sur dB. 
Citons aussi le théorème de FatOU qui 
affirme que toute fonction harmonique 
positive dans la boule B admet une limite 
angulaire en presque tout point x G dB. 

En 194 1, R. S. Martin, afin de généra- 
liser cette représentation intégrale au cas 
d’un ouvert borné, introduisit la fonction 
de Green normalisée ; 


K (*,y) 


G%x , y ) 


y 


il montra l’existence d’un espace compact 
G), unique à un homéomorphisme près, tel 
que G) = w Ct prouva que la famille des 
fonctions x Ux, y) se prolonge continû- 
ment à T = G) - G) et sépare T. On appelle 
F] l’ensemble des points XE T tels que 
la fonction prolongée correspondante 
K(X, y) soit minimale, c’est-à-dire telle que 
toute fonction harmonique > 0 majorée 


par K(X, y) lui soit proportionnelle. À 
toute fonction harmonique h ^ 0 dans G) 
correspond alors sur T une mesure unique 
jü/, ^ 0 portée par Tj telle que : 

h(y) = 

Brelot a résolu un problème de Diri- 
chlet avec donnée frontière sur Y. On peut 
alors faire une étude du comportement à 
la frontière des fonctions harmoniques 
positives, grâce à l’introduction de l’effi- 
lement minimal (Naïm), et généraliser, à 
l’aide de la topologie fine, le résultat de 
Fatou sur les limites angulaires dans le cas 
de la boule (J. L. Doob). 


3. Liens avec l’analyse 
fonctionnelle 

Énergie 

La physique élémentaire nous apprend que 
l’unique charge électrique (J du potentiel 
capacitaire V d’un conducteur donne un 
état d’équilibre et correspond à un mini- 
mum de l’énergie : 


on dit que Y est un potentiel d’équilibre. 
C’est cette idée qui conduisit Gauss, en 
1840, à considérer l’intégrale : 

J (UM-2 f)dti, 

où U M est le potentiel newtonien d’une 
mesure ju donnée par une densité sur une 
surface L rendant minimum l’intégrale. Or 
cela n’est vrai qu’avec des restrictions qui 
furent éclaircies par Frostman en 1935. Ce 
sont, m toiïâ, les idées, de Gauss qui sont 
à l’origine du travail de Cartan sur l’éner- 
gie dont il est question ci-dessous. 
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Dans R”, n ^ 3, avec le noyau newto- 
nien, on appelle énergie mutuelle de deux 
mesures p et v ^ 0 la quantité : 

U M rfv = J U 'du; 

pour toute mesure p, on appelle énergie de 
p le nombre || p || e = V(p| p) et, à l’aide de 
l’inégalité fondamentale (non évidente), 

(pv) < lnllJvL 

il est facile de voir que p >— ► || p || f est une 
semi-norme et, par suite, que l’ensemble 
des mesures positives ou nulles d’énergie 
finie est un cône convexe 

On considère ensuite l’espace vectoriel 
£ = £ + £ + et on prolonge de façon 

standard la semi-norme à f>. L’inégalité 
fondamentale est encore vérifiée et la 
semi-norme prolongée est encore une 
semi-norme sur £, 

Principaux théorèmes 

Théorème 6 ( principe de V énergie de 
Frostman) : La semi-norme j p \\ e est une 
norme sur £. 

Corollaire 7 : L’espace £ est un espace 
préhilbertien muni du produit scalaire 
(M V)., 

Théorème 8 (principe de domination ou 
principe du maximum de Car tan) : Soit 
p E £ et v surharmonique positive majo- 
rant U M sur un support restreint de u 
(c’est-à-dire un ensemble dont le complé- 
mentaire est de u-mesure nulle) ; alors v 
majore U M partout dans R". 

Théorème fondamental (Cartan) : L e 
cône convexe £+ est complet dans £. 

On utilise pour la démonstration de ce 
théorème le théorème de représentation de 
Riesz (théorème 3). Un exemple de Cartan 
montre que £ n’est pas complet. 

Si K est un compact de R'\ on peut 
montrer que l’ensemble T K des mesures 


A portées par K est un cône convexe 

complet de £ ; on obtient (9) et (10). 

Théorème 9 (du balayage) : Soit p E £+. 
La projection p^ de p sur T ^ est carac- 
térisée comme la seule mesure ^ 0 sur K 
telle que, d’une part, on a partout l’inéga- 
lité : 

Umk ^ U ^ 1 

et, d’autre part, pour toute mesure A E £ + , 
on a, h-presque partout, 

U^k = u* 1 . 

On voit que p K est la balayée de p grâce à 
la remarque qui suit le théorème 5 et au 
théorème suivant. 

Théorème 10 : Un borélien de R /r est 
polaire si et seulement s’il est de A-mesure 
nulle pour toute mesure A E £ + . 

Norme et principe de Dirichlet 

Soit fj' 0 l’espace des fonctions numériques 
possédant un gradient fini continu de carré 
intégrable. Pour toute u E âf‘ 0 , on pose : 



L’application u >— *||w|| est une semi- 
norme dans 0* o associée au produit sca- 
laire : 

(u j, u 2 ) = J grâd u j . grâd u 2 dx; 

la condition || u\\= 0 équivaut à u cons- 
tante. 

Pour obtenir une norme on passe au 
quotient fJT par la relation d’équivalence 
naturelle. La norme correspondante 
s’appelle la norme de Dirichlet. Par com- 
modité de langage, on confond une fonc- 
tion de avec sa classe d’équivalence 
dans Y. 

Théorème 11 : Le sous-espace J € des 
fonctions harmoniques est complet dans !J\ 
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Cela permet d’énoncer le principe de 
Dirichlet : pour toute fonction /G îT, il 
existe une fonction harmonique w G JC 
unique rendant minimum le nombre 

Il «~f\ 

En effet, JC étant un sous-espace com- 
plet, on obtient u par projection. 

On peut ainsi résoudre le problème de 
Dirichlet dans les conditions suivantes : 
Soit 0) un domaine borné de R”, n > 2, et 
f une fonction de ST 0 bornée dans 0 et 
admettant un prolongement fini et continu 
à co (noté encore f). La projection de f sur 
JC est Hjr. Si, de plus, 0 est un domaine 
régulier, Hy est l’unique fonction de !J’q de 
norme minimale admettant en tout point la 
même limite que /. 

En songeant à compléter l’espace IP, 
J. Deny a été amené à introduire des 
fonctions appelées « BL précisées » ou 
« BLD », obtenues en précisant des fonc- 
tions introduites par Beppo Levi et Niko- 
dym. Les classes d’équivalence de ces 
fonctions, par rapport à l’égalité presque 
partout à une constante près, forment un 
espace de Hilbert. On peut résoudre un 
problème de Dirichlet correspondant pour 
ces fonctions. 

On peut faire le lien des fonctions BLD 
avec les potentiels U M d’énergie finie : Si 
p G £, alors est une fonction BLD et on 
a : 

IM = «pJmII*. 

où Cp w est un coefficient numérique dépen- 
dant de n. 

4. Théories axiomatiques 
et dérivées 

Méthodes hilbertiennes 

L’espace £ des mesures d’énergie finie 
n’étant pas complet, Deny, en 1950, intro- 


duit les éléments du complété en dévelop- 
pant une théorie du potentiel dans R", où 
le noyau est une distribution et le potentiel 
un produit de convolution de distributions 
(cf. distributions) . Avec quelques restric- 
tions, la théorie de Caftan peut être 
adaptée. Dans l’axiomatisation par Beur- 
ling et Deny des espaces de Dirichlet, on 
utilise le fait que la norme de Dirichlet est 
diminuée par les contractions normales : Si 
V varie moins vite que u, l’intégrale de 
Dirichlet relative à v est plus petite que 
l’intégrale de Dirichlet relative à u . Cette 
remarque, due à A. Beurling, permet de 
donner des démonstrations très courtes et 
très élégantes des résultats fondamentaux 
de la théorie du potentiel. Elle permet aussi 
de démontrer des théorèmes profonds de 
synthèse spectrale en analyse harmonique. 

Théories axiomatiques sans noyaux 
La théorie axiomatique de Brelot et de ses 
extensions ultérieures (Bauer, Constanti- 
nescu et Cornea) est inspirée d’une axio- 
matique probabiliste de Doob et fut pré- 
cédée d’une tentative due à Tautz. Le 
principe en est le suivant. 

Dans un espace Q localement compact, 
on considère un faisceau d’espace vectoriel 
de fonctions numériques continues, appe- 
lées harmoniques (axiome 1). On suppose 
qu’il existe une base de domaines réguliers, 
c’est-à-dire tels qu’il existe une solution du 
problème de Dirichlet (axiome 2), et enfin 
(axiome 3) que tout ensemble filtrant 
croissant de fonctions harmoniques dans 
un domaine 0 tend vers + 00 ou une 
fonction harmonique. La théorie se déve- 
loppe considérablement si l’on ajoute le 
principe de domination (axiome D) 
comme nouvel axiome. 

Les solutions dans un ouvert d’une 
équation du deuxième ordre de type ellip- 
tique à coefficients suffisamment réguliers 
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vérifient les axiomes. Il en est de même, ce 
qui est plus difficile, pour des équations à 
coefficients discontinus (M me Hervé). Cela 
apporte de considérables simplifications à 
l’étude directe de ces équations faites par 
Stampacchia. 

En revanche, les solutions d’équations 
de type parabolique ne vérifient pas les 
axiomes 3 et D. C’est pourquoi Bauer 
modifia l’axiomatique précédente par 
l’introduction d’un nouvel axiome et 
l’affaiblissement de l’axiome 3, afin de 
contenir, dans les applications, les solu- 
tions d’équations de ce type. 

Enfin, J. M. Bony est arrivé à caracté- 
riser de façon presque complète, en termes 
d’opérateurs différentiels, les théories 
axiomatiques du type Brelot, Bauer... dans 
R". 

Soit, par exemple, JC une théorie axio- 
matique de Brelot telle qu’il y ait « suffi- 
samment » de fonctions de classe C 30 . Il 
existe alors un ouvert dense dans lequel est 
défini un opérateur différentiel L à coef- 
ficients de classe C 00 tel que toute fonction 
harmonique de classe C 2 vérifie Lu = 0 et 
même encore, au sens des distributions, si 
U n’est pas de classe C 2 . 

Théorie de Hunt et probabilités 

Soit Q un espace localement compact. On 
appelle noyau N une famille { JLJ v } de 
mesures dépendant mesurablement (en un 
sens à préciser) de x. On note 
u,(E) = N(x, E). À toute f borélienne 
> 0, on associe : 

NA = jfdn x = J N(x,dy)f(y), 

également borélienne. On peut considérer 
N comme une application linéaire positive 
de l’ensemble des fonctions boréliennes 
positives dans lui-même. On peut donc 


composer deux noyaux. Si v est une mesure 
positive, on définit la mesure vN par : 

vN(E) =Jn(*, E)üfv(;c). 

L’exemple classique est le noyau : 

N(y, E) = J^A(|x —~y\idx 

dans R”. Ici Nfest le potentiel newtonien 
de densitéfet vN est absolument continue 
par rapport à la mesure de Lebesgue, ayant 
comme densité le potentiel U”. 

On dit que N satisfait au principe 
complet du maximum si, pour toute cons- 
tante a ^ 0 et tout couple (/, g) de fonc- 
tions positives universellement mesura- 
bles, la relation : 

a + N/* > N g xi 

pour tout x tel que g(x) > 0, entraîne : 

a + N/, > N gx , 
pour tout x (E Û. 

Avec certaines restrictions satisfaites 
dans les applications, G. A. Hunt montre 
qu’on peut associer à un noyau N, satisfai- 
sant au principe complet du maximum, un 
semi-groupe P, (défini pour î ^ 0, 
Pç-j., — P s o P ; ) de noyaux, vérifiant des 
conditions de continuité à l’origine, tel que : 

cela lui permet de développer une théorie 
du potentiel purement probabiliste. On 
appelle excessives les fonctions f ^ 0 véri- 
fiant : 

P ,/</, limP,/ = /; 

en cas d’égalité, f est dite invariante. 
Quand J ^ 0 n’a pas de minorante inva- 
riante ^ 0 autre que zéro, f est appelée 
potentiel. 
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Dans les bons cas, P, peut être inter- 
prété comme le semi-groupe de transition 
d’un processus de Markov. De tels pro- 
cessus sont appelés processus de Hunt. 
Dans le cas particulier du mouvement 
brownien, le générateur infinitésimal (déri- 
vée à l’origine du semi-groupe) est l’opé- 
rateur A, ce qui permet d’identifier les 
fonctions surharmoniques et les fonctions 
excessives. Il en est de même dans le cas 
général d’une théorie axiomatique du type 
Brelot. M mc Hervé a construit un noyau 
vérifiant des conditions qui permirent à 
P. A. Meyer de montrer l’existence d’un 
semi-groupe dont les fonctions excessives 
sont précisément les fonctions sur harmo- 
niques de la théorie. 

Cette identification va beaucoup plus 
loin et permet d’interpréter en termes 
probabilistes les faits les plus importants de 
la théorie du potentiel : balayage, effile- 
ment, espace de Martin, etc. La théorie du 
potentiel est donc une source d’inspiration 
considérable pour les probabilistes qui 
s’occupent des processus markoviens. 

Théorème 

de représentation intégrale 

Les fonctions harmoniques positives dans 
un ouvert borné (0 C R" forment un cône 
convexe C : celles qui valent 1 en un point 
forment une base convexe compacte B 
(pour la convergence compacte) du cône et 
les fonctions minimales de cette base sont 
les éléments extrémaux de B. On peut aussi 
interpréter la représentation intégrale de 
Martin d’une fonction u (E B en disant que 
U est le barycentre d’une mesure ju portée 
par l’ensemble des points extrémaux 
(modulo une identification des éléments 
minime. y, c’est-à-dire extrémaux, de B 
avec les points de l’ensemble F ] défini à la 
fin du chapitre 2). 


Cette remarque a permis à G. Choquet 
de démontrer le théorème extrêmement 
profond qui suit. 

Théorème . Soit C un cône convexe et B 
une base compacte de C. Si B est métri- 
sable, tout Y G B est barycentre d’une 
mesure unitaire p portée par l’ensemble 
des points extrémaux. De plus, si C est 
réticulé pour son ordre, p est unique. 

Si B n’est pas métrisable, le problème 
est beaucoup plus compliqué. En particu- 
lier, l’ensemble des points extrémaux n’est 
pas nécessairement mesurable. 

On peut partir de ce théorème pour 
retrouver la représentation intégrale de 
Martin : c’est une méthode beaucoup plus 
simple. Ce théorème permet également de 
donner une représentation intégrale de 
Riesz dans les espaces harmoniques de Bre- 
lot (M me Hervé, G. Mokobodski) et même, 
sous une forme moins satisfaisante, dans les 
axiomatiques affaiblies (Mokobodski). 

Théorie de la capacité 

Une capacité généralisée , au sens de Cho- 
quet, sur un espace topologique séparé X 
est une fonction réelle C d’ensemble, 
définie sur toutes les parties de X ; elle est 
croissante, descend sur les compacts et 
monte sur les ensembles quelconques. La 
capacité extérieure classique dans R" et les 
mesures extérieures sur X localement com- 
pact sont des exemples de capacité géné- 
ralisée. Un ensemble A C X est dit capa- 
citahle si : 

C(A) = sup C(K), 

K 

la borne supérieure étant prise pour K 
parcourant l’ensemble des compacts 
contenus dans A. 

Pm terminer, ara vva théorème, 
dû à Choquet, qui est très utile en théorie 
de la mesure et en théorie des probabilités. 
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Il nous faut pour cela donner quelques 
définitions : On dit qu’un ensemble dans 
un espace topologique est un K a si c’est 
une réunion dénombrable d’ensembles 
compacts ; un K a6 est un ensemble qui est 
intersection dénombrable de K CT ; enfin, on 
dit qu’un sous-ensemble A d’un espace 
topologique séparé est analytique si A est 
l’image continue d’un K CTÔ contenu dans 
un espace compact. Le théorème de 
Choquet s’énonce alors : Tout ensemble 
analytique contenu dans un K a est capa- 
citable. 

ARNAUD DE LA PRADELLE 
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PRODUITS INFINIS -> SÉRIES 
& PRODUITS INFINIS 


PROJ ECTIFS ESPACE & REPÈRE 


E space projectif . Étant donné un espace 
vectoriel E sur un corps commutatif 
K, on considère dans E’ = E {0} la 


relation G entre deux éléments x et y 
définie par : 

3k EK, \ 7^0, y = \x. 

La relation G est une relation d’équi- 
valence et l’ensemble quotient E'/G est 
appelé espace projectif déduit de E et est 
noté P(E). L’ensemble E est appelé espace 
vectoriel sous-jacent de P(E). Une classe 
d’équivalence, élément de P(E), est appe- 
lée point projectif; on désigne par tt 
l’application canonique qui à un élément 
de E’ associe sa classe dans P(E). Lorsque 
E = K" +l , l’espace projectif déduit se note 
P„(K). Si E est de dimension ri + 1, la 
dimension de P(E) est, par définition, tl. Il 
faut toutefois remarquer que P(E) n’est 
pas un espace vectoriel. 

L’espace projectif réel ou complexe 
P, (R) ou P„(C) est une variété compacte 
non orientable. L’expace affine réel ou com- 
plexe de dimension n se plonge de manière 
naturelle dans cet espace projectif ; ce plon- 
gement correspond géométriquement à 
l’adjonction de « points à l’infini », réels ou 
imaginaires, à cet espace affine. 

Variété linéaire projective. Soit F un 
sous -espace vectoriel de E, l’image par 7T de 
F’ = F {0} est, par définition, une variété 
linéaire projective de P(E). On peut aisé- 
ment montrer que l’intersection d’une 
famille quelconque de variétés linéaires 
projectives est une variété linéaire projec- 
tive et que l’espace vectoriel sous-jacent de 
cette intersection est l’intersection des espa- 
ces vectoriels sous-jacents des variétés de la 
famille. Une variété projective déduite d’un 
hyperplan de E s’appelle un hyperplan pro- 
jectif, et sa dimension (lorsque dim (E) = n 
H- 1) est égale à n 1 ; un espace projectif 
de dimension 1 (resp. 2) est appelé droite 
projective (resp. plan projectif). Soit X un 
sous-ensemble de P(E) ; on appelle variété 
linéaire engendrée par X l’intersection de 
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toutes les variétés linéaires contenant X. 
Soit k + 1 points de P(E) ; on dit qu’ils 
forment une partie projectivement libre si 
la dimension de la variété engendrée par 
eux est égale à k ; ils sont projectivement 
liés si la dimension de la variété est infé- 
rieure à k. On peut montrer que k -f- 1 
points 7T(a',) de P(E) sont libres si et 
seulement si les k + 1 points x, sont libres 
dans E. Ainsi, bien que P(E) ne soit pas 
un espace vectoriel, la notion d’indé- 
pendance se conserve. Par suite, on a 
des énoncés de théorèmes sur les dimen- 
sions équivalents aux énoncés sur les 
dimensions des sous-espaces vectoriels, en 
particulier le théorème de la « base incom- 
plète ». 

Coordonnées homogènes ; repère projec- 
tif. Soit B = (£»,•), 1 ^ i ^ n + 1, une base 
de l’espace vectoriel E de dimension 
n + 1. Tout élément x de E s’écrit : 

H + 1 

* = 

i = 1 

avec Xi E K. Le ( n + l)-uple (X[ , X 2 , 

X H _|_ j ) s’appelle système de coordonnées 
homogènes du point 7T(x) de P(E). Soit e$ 
l’élément de E de coordonnées : 

n + 1 

e o=2> i; 

i - I 

on appelle repère projectif l’ensemble des 
n + 2 points ir(<? 0 ), TTfé',, .... ir(<?„ + |). 

On peut donner une représentation, à 
l’aide de coordonnées, d’une variété 
linéaire projective P(F) : il suffit de donner 
la représentation du sous-espace vectoriel 
sous-jacent F privé de 0. Soit 7r(g ; ), 1 ^ j 
^ k + 1, une famille libre engendrant 
pil/l .Désignons par 1 . ^ n.-i- l, 

le système de coordonnées homogènes du 
point 7T(g,). Alors un système de coordon- 


nées homogènes d’un point de P(F) est 
donné par : 


k + 1 



; = 1 


où les Xj appartiennent à K et ne sont pas 
tous nuis. Ces n -f- 2 formules définissent 
une bijection entre P,+,(E) et P(F) qui est 
une représentation paramétrique de la 
variété projective. 

Dans le cas particulier de P„(R), où 
R" +1 est muni de la base canonique, le plon- 
gement, indiqué ci-dessus, de l’espace affine 
de dimension n identifié à R" dans P /; (R) 
fait correspondre au point (À|, A„ A„) le 
point de coordonnées homogènes (À j , À 2 ,. • • • 
A,„ A„„) ; les « points à l’infini » de P„(R) 
sont caractérisés par la condition = 0 

et forment donc un hyperplan projectif. 

La géométrie projective est l’étude des 
espaces projectifs et des variétés linéaires 
projectives, ainsi que des invariants par le 
groupe projectif. 

JACQUES MEYER 


PROJECTIVES APPLICATIONS 


S oit E et F deux espaces vectoriels sur 
un même corps commutatif K, P(E) et 
P(F) les espaces projectifs déduits de E et 
de F, /une application linéaire de E dans 
F et N = ker (f) le noyau de f. Comme 
l’image par / d’une droite de E non 
contenue dans N est une droite de F, la 
restriction d e/à E— N est compatible avec 
les relations d’équivalence sur E— N et F’ 
= F— {0}. On peut donc déduire de/ une 
application g de P(E) — P(N) dans P(F) 
par passage au quotient. L’application g 
est dite application linéaire projective ou 
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encore, par abus de langage, application 
projective de P(E) dans P(F). 

Notons quefet À/, où A est un scalaire 
non nul, donnent la même application 
déduite. Réciproquement, si l’on se donne 
une variété linéaire projective P(N) et une 
application projective g de P(E)-P(N) 
dans P(F), toutes les applications linéaires 
dont g est déduite s’obtiennent à partir de 
l’une d’entre elles par multiplication par un 
scalaire non nul. Si l’on considère les 
applications projectives bijectives de P(E) 
dans P(F), on voit aisément que : 

- les applications linéaires dont une appli- 
cation projective bijective est déduite sont 
elles-mêmes bijectives ; 

la composée de deux applications pro- 
jectives bijectives est une application pro- 
jective bijective ; 

- les applications projectives bijectives de 
P(E) sur P(E) forment un groupe, appelé 
groupe projectif de P(E) et noté PGL(E) ; 
lorsque E = K n+1 , ce groupe se note 
PGL„(K) ou PGL(*,K) ; 

- lorsque les espaces projectifs P(E) et 
P(F) sont de dimension finie, et si leurs 
dimensions sont égales, toute application 
projective injective de P(E) dans P(F) est 
bijective et donc inversible. De plus, on a 
le théorème suivant : la donnée dans P(E) 
d’une famille (7 f(fj) de n + 2 points, 
formant un repère projectif, et dans P(F) 
d’une famille (TT '(/^) de n + 2 points, 
formant un repère projectif, détermine une 
application projective et une seule de P(E) 
dans P(F), appliquant 7T(^-) sur 7 De 
plus, cette application est bijective. 

JACQUES MEYER 



QUADRATIQUES forv.es 


L a notion de forme quadratique inter- 
vient dans toutes les parties des mathé- 
matiques. Elle est à la base de la géométrie 
euclidienne et de la mécanique classique 
(énergie cinétique), et aussi de la notion 
d’espace de Hilbert, de la théorie spectrale 
et de leurs nombreuses applications à 
l’analyse fonctionnelle (équations différen- 
tielles, aux dérivées partielles ou intégra- 
les). Elle est étroitement liée au concept de 
dualité. Enfin, l’étude arithmétique des 
formes quadratiques a été le point de 
départ de la théorie des nombres algébri- 
ques et a eu d’importantes répercussions 
sur la théorie des fonctions automorphes. 

* 


1. Généralités 

En algèbre classique, on appelle « forme 
n-aire de degré r » un polynôme homogène 
de degré r par rapport à ri variables ; pour 
r = 1 , on dit « forme linéaire » et, pour 
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Y = 2, on dit « forme quadratique ». Dans 
la mathématique actuelle, on généralise la 
notion de forme quadratique comme on a 
généralisé celle de forme linéaire 
algèbre linéaire et MULTILINÉAIRE) : étant 
donné un anneau commutatif A et un 
A-module M, on considère les applications 
Q de M dans A qui vérifient une relation 
de la forme : 

(1) Q(À* + nj) = * 2 A (x,y) 

+ X|aB(x,y) + m 2 C(x,j7), 

quels que soient X et y dans M, À et p dans 
A. En donnant à À et p les valeurs 0 ou 1, 
on voit aussitôt que : 

A {x t y) = Q(x), C (x,y) = Q(y) 

et : 

B{x,y)= Q(x + y)-Q(x)-Q(y); 

en exprimant de plusieurs manières 
Q(x + y + z), pour x, y et z dans M, on 
voit sans peine que l’expression : 

D(x,y,z) = B(x +y,z) — B (x,z) — B (y,z) 

est symétrique en X , y et z et que l’on a par 
suite : 

D(Xx,Ay,Àz) = X 3 D (x,y,z); 

d’autre part, on a : 

D(Ax, \y, ïz) = \ 2 T>{x , y , z) y 

donc D(.v, y , z) = 0 lorsque A est sans 
diviseur de zéro et contient au moins trois 
éléments. Pour un anneau commutatif A 
quelconque, on dit que Q est une forme 
quadratique sur M si D(a\ y, z) = 0 quels 
que soient x, y et z dans M, c’est-à-dire si 
B est une forme bilinéaire (nécessairement 
symétrique). On dit que cette forme bili- 
néaire est associée à la forme quadratique 
fî Si , (aaiû) i r diïiïtw A, Viquaillnr _ ü 
a une solution unique pour tout OC (z A 
toute forme bilinéaire symétrique B sur 


M X M détermine inversement une forme 
quadratique Q à laquelle elle est associée, 
puisque : 

(cf fi(x,*)= Q(2*)-2Q(x) = 2Q(x). 

La définition précédente montre par 
récurrence que, si a j9 . . . . ü m sont des 
éléments de M et si . . . . c, m sont des 
scalaires de A, on a : 

( 2 ) Q( ti“j) = «n5î + + a mm K 2 „ 

7=1 

+ a tJ Uj, 
i<j 

où a jj = B(a h a,) pour i #jet a h = Q (a,), 
donc B (a h a,) = 2 a u . En particulier, si les 
a, forment une hase de M, on retrouve la 
définition classique des formes quadrati- 
ques. 

Exemples 

Si l’on a été amené à donner une définition 
aussi générale, c’est parce que l’on ren- 
contre naturellement des formes quadra- 
tiques de types très variés dans les appli- 
cations. L’exemple le plus connu de forme 
quadratique est le « carré scalaire », dont 
l’étude est exactement la géométrie eucli- 
dienne. Deux des parties les plus impor- 
tantes des mathématiques contemporai- 
nes, la géométrie riemannienne et la 
théorie des espaces de Hilbert, sont des 
extensions de cette étude dans deux direc- 
tions : la forme quadratique est « infinité- 
simale » en géométrie riemannienne, et 
l’espace où elle est définie est de dimension 
infinie dans la théorie hilbertienne. 

Dans tous ces cas, la forme est « posi- 
tive non dégénérée » (cf. infra , chap. 2). 
Ma A ihrivÇmTcsmOn dégénérées iTOIi pusv- 
tives n’ont pas moins d’importance : leur 
théorie (pour les espaces de dimension 
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finie) a deux « traductions » classiques : la 
théorie des coniques, des quadriques et de 
leurs généralisations aux dimensions supé- 
rieures, et d’autre part les géométries 
« non euclidiennes » (cf. GROUPES 
Groupes classiques et géométrie ; QUADRI- 
ques) ; l’aspect « infinitésimal » de cette 
théorie est la théorie des espaces pseudo 
riemanniens, qui est à la base de la théorie 
de la relativité. Les formes quadratiques à 
coefficients complexes correspondent aux 
quadriques (et leurs généralisations) dans 
les espaces complexes ; et c’est une forme 
à coefficients complexes, la forme de 
Killing, sur laquelle repose la classification 
des groupes de Lie semi- simples. 

L’étude des formes quadratiques à coef- 
ficients entiers, débutant avec Fermât et 
Euler, a été le ferment le plus actif dans le 
développement de la théorie des nombres : 
la théorie des formes binaires, équivalente 
à celle des corps quadratiques, a été, avec 
Gauss, le point de départ de la théorie des 
nombres algébriques ; celle des formes 
quaternaires est étroitement liée à la théo- 
rie arithmétique des quaternions et celle 
des formes à un nombre quelconque de 
variables est à l’origine du développement 
moderne de la théorie des groupes arith- 
métiques et des fonctions modulaires à fl 
variables. 

Tout récemment, les formes quadrati- 
ques ont reçu des applications plus inat- 
tendues. En topologie différentielle, c’est la 
considération d’une forme quadratique sur 
le corps à deux éléments Fi qui permet de 
définir un nouvel invariant, grâce auquel 
on a pu donner le premier exemple d’une 
variété topologique non susceptible d’être 
munie d’une structure différentielle 
(M. Kervaire) ; d’autres formes quadrati- 
ques interviennent en cohomologie (théo- 
rie de l’index) et en K-théorie, et l’on est 
même amené pour certaines questions à 


généraliser la notion de forme quadratique 
en considérant des applications de M dans 
un second A-module M’ (« applications 
quadratiques »). L’application la plus 
imprévue est sans doute celle qui permet 
d’exclure a priori certains entiers N dans la 
recherche des plans projectifs finis (non 
desarguiens) ayant N + 1 points : on 
montre en effet que, s’il existe un tel plan, 
alors il y a une matrice carrée A d’ordre 
N 2 + N + 1 = n à coefficients entiers 
telle que ’A . A = B, où B est une matrice 
d’ordre n ayant tous ses éléments égaux à 
1, sauf ceux de la diagonale principale 
égaux à N 1 (Bruck-Ryser) : la théorie 
de Minkowski-Hasse (cf. infra. Résultats 
spéciaux, in chap. 2) donne des conditions 
arithmétiques de possibilité d’une telle 
relation qui permettent d’exclure certaines 
valeurs de N. 

T ransformation 
des formes quadratiques 
La notion fondamentale à la base de toute 
la théorie des formes quadratiques est celle 
de transformée d’une telle forme par une 
application linéaire : si M et N sont deux 
A-modules, si g : M — ► N est une applica- 
tion linéaire et Q une forme quadratique 
sur N, x l— * QfeW) est une forme quadra- 
tique sur M, dite transformée de Q par g ; 
si B est la forme bilinéaire associée à Q, la 
forme : 

associée à Q o g, est dite transformée de B 
par g. On se bornera dans toute la suite aux 
A-modules de type fini (pour la théorie 
hilbertienne, voir l’article théorie spec- 
trale) . Lorsque M est un A-module libre, 
pour toute base (e,), 1 ^ y ^ w, de M, la 
matrice carrée symétrique T = (B(<? ; , Cf.)) 
est appelée la matrice de B (ou de Q) par 
rapport à cette base ; si N est un second 
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A-module libre, si (/j), 1 ^ ^ w, est une 

base de N et X la matrice de type (m, n) 
d’une application linéaire g de M dans N 
relativement aux bases choisies, alors la 
matrice de la transformée Q o g de Q par 
rapport à (f/) est ! X.T.X. 

Les problèmes qui se posent naturelle- 
ment dans la théorie des formes quadra- 
tiques sont les suivants. 

A) Étant donné deux formes quadrati- 
ques Qj et Q n sur des A-modules M, et M->, 
la forme Qo est-elle transformée de la 
forme Q 3 ? On dit encore alors que « Q 3 
représente Q 1 ». En particulier, si M, et Mi 
sont libres et si T\ et T 2 sont les matrices 
de Qj et de Q 2 par rapport à des bases, une 
réponse positive à la question entraîne 
l’existence d’une matrice X à éléments 
dans A telle que : 

(3) t X.T ] JC = T,; 

inversement, cette existence entraîne que 
Q 2 est transformée de Qj lorsque, dans A, 
l’équation = (X a toujours une solution 
unique. On notera que, dans ce dernier cas, 
lorsqu’on prend M 2 = A de sorte que 
T 2 = (a) est une matrice à un seul élément, 
résoudre l’équation (3) revient à trouver 
dans M, les solutions de 2Q|(.v) = a que 
l’on appelle « représentations de l’élément 
a/2 par Qj ». 

B) « Classer » les formes quadratiques 
sur un module M pour diverses sortes de 
relations d’équivalence entre ces formes. 
De façon précise, on se donne un SOUS- 
groupe T du groupe des bijections linéaires 
de M sur lui-même, et on considère comme 
équivalentes deux formes quadratiques 
transformées l’une de l’autre par une 
application g G T. On peut encore dire que 
l’ensemble des formes quadratiques sur M 
est un À-module <2(M) dans lequel le 
groupe F opère linéairement , et on cherche 
les orbites de F pour cette action. 


C) Étude du groupe de toutes les bijec- 
tions linéaires de M qui transforment une 
forme quadratique en elle-même. Nous en 
avons donné d’importants exemples dans 
l’article GROUPES - Groupes classiques et 
géométrie. Notons simplement que les 
formes quadratiques sont exceptionnelles 
à cet égard parmi les formes de degré 
> 1 ; pour les formes de degré ^ 3, le 
groupe des transformations linéaires 
laissant invariant la forme est en général 
fini. 


2. Formes quodratiques 
sur un corps 

Nous distinguons deux cas, suivant que la 
caractéristique du corps de base K est 
distincte de 2 ou égale à 2. 

Corps de caractéristique ^ 2 

Résultats généraux 

On peut se borner ici à considérer le 
problème de transformation d’une forme 
quadratique en une autre sous la forme (3). 
Un premier invariant est le rang de la 
matrice T d’une forme quadratique Q ; il 
est aussi appelé rang de Q ou rang de la 
forme bilinéaire associée B, et noté rg(Q) 
ou rg(B). C’est un entier qui peut prendre 
l’une quelconque des valeurs entre 0 et la 
dimension n de l’espace vectoriel V où est 
définie Q. On dit que la forme Q (ou B) 
est non dégénérée si rg (Q ) — n \ la 
forme bilinéaire B définit alors un isomor- 
phisme cp de V sur son dual V* (cf. algèbre 

LINÉAIRE ET MULTILINÉAIRE) paf la rela- 
tion : 

<*, <P0)> = 
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pour x et y dans V ; cela permet de définir 
dans V les notions de vecteurs orthogo- 
naux, de sous-espace isotrope et de SOUS* 
espace totalement isotrope (cf. GROUPES ■ 
Groupes classiques et géométrie, 
chap. 3 ). 

Un second invariant est l’indice de Witt 
v ^ n/2 (cf. groupes - Groupes classiques 
et géométrie, chap. 3 ) ; l’espace V se 
décompose en somme directe d’un $OUS- 
espace W de dimension n — 2 v, ne conte- 
nant aucun vecteur isotrope ^ 0, et d’un 
sous-espace orthogonal à W, dans lequel 
l’indice de Witt de la restriction de Q à ce 
sous-espace est v ; pour n et v donnés, la 
classe d’équivalence de la forme Q w , 
restriction de Q à W, détermine entière- 
ment celle de Q, ce qui permet de ramener 
le problème d’équivalence au cas des 
formes anisotropes (c’est-à-dire d’indice 0). 

On appelle discriminant de Q (ou 
de B) par rapport à une base de Y le 
déterminant de la matrice de B par rapport 
à cette base ; comme la relation ( 3 ) 
entraîne : 

det (r 2 ) = det (r , )(det {X )) 2 , 

on voit que le discriminant dépend de la 
base choisie, mais sa classe d(Q) dans 
le groupe quotient K*/K * 2 du groupe 
multiplicatif K* de K par le sous-groupe 
des carrés dans K* est un invariant 
de Q. 

Enfin, pour deux éléments a et (3 de K, 
on désigne par (a, P) l’algèbre de quater- 
nions (généralisés), espace vectoriel de 
dimension 4 sur K ayant une base formée 
de 1 (élément unité) et de trois éléments 
Xj, X2 et X3 avec la table de multiplica- 
tion : 

x\ = a, x; = (3, *3 - — a(3, 
x \ x i - — x 2 x ï = *3, *1*3 = — *3*1 = cu 2 , 

*2*3 = —*3*2 = — P*j. 


C’est une algèbre simple de centre K, si 
aP ^ 0 . Cela étant, il y a toujours des 
bases (e-), 1 ^ y ^ n, de V orthogonales 
pour Q, autrement dit telles que : 

(4) Q(*) = Y^ajt),x = 

ainsi Q(x) est somme de « termes carrés ». 
On appelle algèbre de liasse de Q 
pour cette base le produit tensoriel des 
algèbres de quaternions (a,, a, a 2 ,,, a ,), 
pour 1 ^ j ^ n, et on démontre que 
cette algèbre S(Q) ne dépend pas, à 
isomorphie près, de la base orthogonale 
choisie. 

On peut prouver que, pour n ^ 3 , les 
invariants rg(Q), d(Q) et S(Q) caractéri- 
sent, à équivalence près, les formes qua- 
dratiques sur un corps quelconque K (de 
caractéristique ^ 2) ; mais cela n’est 
plus exact pour n ^ 4 . On n’a, dans ce cas. 
que des résultats pour des corps particu- 
liers. 

Résultats spéciaux 

a) Le corps K est algébriquement clos ; 
un seul invariant suffit, le rang rg(Q) ; pour 
rg(Q) = n, on a v = [n/2], partie entière 
de n/2, 

b) Le corps K est le corps R des 
nombres réels ; pour toute base orthogo- 
nale (e } ) de V, si : 

n 

Q(V = ^ ajK), 

fri 

le nombre p (resp. q) des oty qui sont > 0 
(resp. < 0) est indépendant de la base 
choisie (« loi d’inertie » de Sylvester) ; on 
dit que (p , q) est la signature sig (Q) de Q ; 
les nombres p ci q caractérisent les formes 
quadratiques à équivalence près ; on a 
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rg(Q) = p + q ; si p + q — fl, on a 
v = inf (p, y) et d( Q) est la classe de (— 1)^. 
Le groupe R*/R* 2 a ici deux éléments. 

c) Le corps K est fini ; dans ce cas, le 
groupe K*/K* 2 a encore deux éléments ; 
les invariants rg(Q) et d( Q) caractérisent 
Q, à équivalence près ; si rg(Q) — n, on a 
v ^ 1 pour n > 3. 

d) Le corps K est un corps local (cf. 
théorie des NOMBRES - Nombresp-adiques), 
d’idéal maximal Pour deux éléments a 
et (3 de K. le symbole de Hilbert (a, (3)^ est 
défini comme égal à 1 si l’équation 
air + Pn 2 = I a une solution dans K, 
comme égal à — 1 dans le cas contraire (cf. 
divisibilité, chap. 4) ; et on montre que 
deux algèbres de quaternions (a, p) et (a', 
P') sont isomorphes si et seulement si on 
a (a, P)jj = (a\ P')p. On associe alors à la 
forme quadratique Q son symbole de HüSSC 
S,(Q), égal par définition au produit des 
symboles de Hilbert (a ; -, Otj Oh ... (X f )y pour 
toute expression (4) de Q à l’aide d’une 
base orthogonale. On prouve que les 
invariants rg(Q), d(Q) et S,(Q) caractéri- 
sent Q, à équivalence près. On a toujours 
v ^ 0 pour rg(Q) ^ 5. 

e) Le corps K est un corps de nombres 

algébriques (cf. théorie des NOMBRES 
Nombres algébriques). Pour toute place v 
de K, le corps K se plonge canoniquement 
dans le corps local complété K v , et on peut 
donc considérer une forme quadratique Q 
sur K comme une forme quadratique Q v 
sur K,. La théorie est entièrement ramenée 
au cas des corps locaux par le principe de 
HüSSC : pour qu’une forme quadratique Q’ 
soit transformée d’une forme Q, il faut et 
il suffit que Q’, soit transformée de pour 
chaque place v (finie ou à l’infini). Les 
invariants rg(Q), </(Q), W u ' foute 

place finie, et sig(Q v ) pour toute place 
réelle à l’infini, caractérisent donc Q, à 


équivalence près (théorème de Hasse- 
Minkowski). Les symboles S^(Q^) sont 
égaux à 1, sauf pour un nombre fini de 
places finies ÿ, et on a la loi de réciprocité 
de Hilbert : 

n^Q*) = i. 

$ 

Corps de caractéristique 2 
Soit K un corps de caractéristique 2, Y un 
espace vectoriel de dimension n sur K et 
Q une forme quadratique sur V. La forme 
bihnéaire B associée à Q est alors alter&, 
autrement dit B(x, x) = 0 pour tout 
JC G V ; son rang rg (B) est par suite un 
nombre pair 2p. Soit V 1 le sous-espace de 
V, formé des x E V tels que BU, y) = 0 
pour tout y E V ; sa dimension est fl 2 p 
et on a : 

Q(Lc + M y) = WQQc) +m 2 QO), 

pour x et y dans V. L’ensemble Vq des 
Y E V 1 tels que Q(s) = 0 est donc un 
sous-espace vectoriel de V. Si q n 2 p 
est sa dimension, on dit que 2 p + q est le 
rang rg (Q) et on appelle défaut de Q 
l’entier S(Q) = y = rg (Q) — rg (B). Si U 
est un supplémentaire de V 0 dans V 1 , si W 
est un supplémentaire de V 1 dans V et si 
l’on prend une base de V qui soit réunion 
d’une base symplectique (<? y ), 1 ^ j ^2/7, 
de W (c’est-à-dire telle que B(e ; , e k ) = 0 
sauf pour les couples (e ; -, ), pour les- 

quels e j+p ) = B(e j+P , ej) = 1 pour 
1 ^ j ^ p). d’une base (ef 2/7+1 ^ j 
^ 2 p + q, de U et d’une base (ef 
2p + (, + \ ^ j ^ il, de V 0 , alors on 
obtient, pour : 

X= Yj ijej ’ 

jT\ 
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l’expression de Q(x) suivante : 

p 

(5) Q(x) = ^ (afi) + Z jZj +p + V,Z] +P ) 

j= l 

Ip+q 

j = 2p+l 

où la relation : 

2 P +q 

2>) = o 

J = 2p + 1 

entraîne tj = 0 pour 

2p 4- 1 ^ j ^ 2p -b q.Ledéfautqnepeut 
être > 0 que si K est imparfait , c’est-à-dire 
que le sous-corps K 2 de K formé par les 
carrés des éléments de K est distinct de K ; 
plus précisément, on a q ^ [K : K 2 ]. 

Les entiers p et q sont évidemment des 
invariants de Q. On dit qu’un sous-espace L 
de V est totalement singulier si Q(x) = 0 
dans L ; pour les formes de rang n , la dimen- 
sion d’un tel espace est ^ p. Le maximum v 
des dimensions des espaces totalement 
singuliers est encore appelé l’indice de Wîtt 
de Q et est un invariant de cette forme. 

Si, pour une base (e,) choisie comme 
plus haut, on forme l’élément : 



J= ‘ 


on dit que cet élément est le pseudo- 
discriminant (ou invariant d’Arf) de Q par 
rapport à cette base. Pour une autre base 
du même type, le pseudo-discriminant est 
de la forme : 

A(Q) + ¥ + 1 

pour un élément Ç Eï K ; comme les élé- 
ments £ 2 + £ forment un sous-groupe P du 
groupe additif K, la classe d(Q) de A(Q) 
dans le groupe quotient K/P est encore un 
invariant de Q. 


Enfin, on peut généraliser aux corps de 
caractéristique 2 la notion d’algèbre de 
quaternions et obtenir ainsi pour Q un 
invariant qui généralise l’algèbre de Hasse 
définie supra (cf. Résultats généraux , in 
Corps de caractéristique # 2). Grâce à ces 
invariants, on peut, pour certains corps de 
caractéristique 2, obtenir une classification 
complète des formes quadratiques sur ces 
corps. 


3. Réduction 

des formes quadratiques 

Nous ne considérerons plus à partir de 
maintenant que des formes quadratiques 
non dégénérées sur le corps R des nom- 
bres réels, définies dans un espace R/, et 
nous nous intéresserons auxsous-groupes V 
du groupe linéaire GL(r, R) opérant à 
droite, par (g, Q) i— ► Q o g» dans l’espace 
i2(R r ) de ces formes. Deux cas sont 
particulièrement étudiés, correspondant 
au groupe orthogonal T = 0(r, R) et au 
groupe T = SL(r, Z) des matrices inver- 
sibles de déterminant 1 à coefficients 
entiers. Nous renvoyons pour le premier 
cas à l’article théorie spectrale, le pro- 
blème étant celui de la réduction d’une 
forme quadratique (ou d’une « hyperqua- 
drique ») à ses « axes ». La théorie de la 
« réduction » correspond au second cas. 
Comme les orbites de GL(r, R) dans 
Q(R r ) sont les ensembles de formes de 
signature donnée (p , y), avec p + q = i 
(cf. supra, Résultats spéciaux, in Corps de 
caractéristique ^ 2), il y a lieu de distin- 
guer le cas des formes positives non 
dégénérées (c’est-à-dire p — r et y = 0) et 
le cas des formes où p et q sont tous deux 
> 0 (dites aussi « indéfinies »). 
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Formes positives 

L’ensemble JC (ou JC r ) de ces formes s’iden- 
tifie à celui des matrices symétriques posi- 
tives inversibles : c’est un « espace symétri- 
que » JC = K\G d’Élie Cartan, avec 
G = GL(r, R) et K = 0(r, R) qui est le 
stabilisateur de la matrice unité. Le pro- 
blème essentiel de la théorie de la réduction 
est de trouver dans JC un « ensemble fon- 
damental » aussi « petit » que possible 
tel que toute orbite de T dans JC le rencon- 
tre : il suffit de prendre l’image canonique 
dans JC d’un ensemble ê C G tel que 
G = {§ • T. Si l’on désigne par A le SOUS- 
groupe commutatif de G formé des matri- 
ces diagonales à termes a i} > 0 et par N le 
sous-groupe des matrices triangulaires 
supérieures (n,) telles que n;j = 0 si j < i et 
rijj = 1 pour 1 i ^ r, toute matrice 
gE G s’écrit d’une seule manière : 
g = k • a • n, avec k E K, a E A et n E N ; 
cette décomposition s’appelle « décompo- 
sition d’Iwasawa » (cf. GROUPES ■ Groupes 
de Lie, chap. 2). 

On appelle domaine de Siegel dans 
G l’ensemble des matrices k • a * n, avec 
a a < t • «/+ i,/+i pour 1 ^ ^ r — 1 e t 

lïjj ^ u pour / < j ; une méthode remon- 
tant à Gauss (pour r = 2) et à Hermite 
prouve qu’il répond à la question posée, 
pour t ^ 2/VT et u ^ 1/2. L’intérêt du 
choix d’un tel domaine fondamental (8 est 
que son intersection avec SL(r, R) a une 
mesure de Haar finie ; d’autre part, si M 
est un ensemble de matrices m à coeffi- 
cients entiers de déterminants bornés, alors 
l’ensemble M ê des m E M telles que 
<8 H Æ . ïïl soit non vide est fini (Siegel). En 
outre, le fait que pour les valeurs de 

î et de u indiquées plus haut, soit un 
domaine fondamental entraîne l’inégalité 

d’Hermitc 

(6) min QW < (4/3)"— 1 > /2 (det Q)"', 
xez r -{o} 


où le déterminant est celui de la matrice de 
Q par rapport à la base canonique de R”. 
Enfin, cela entraîne aussi que le groupe T 
est de type fini . 

Un procédé de « réduction » plus fin, 
dû à Minkowski, fournit dans JC un 
domaine fondamental plus petit que les 
domaines de Siegel <f§' ( w , qui a la propriété 
de ne pouvoir avoir que des points fron- 
tières en commun avec ses transformés par 
T. Pour r = 2, en écrivant une forme 
quadratique positive a(x + Tj)(jC -j- T}’), 
avec a > 0 et t nombre complexe tel que 
Im T > 0, on identifie l’espace JC (1 * des 
formes quadratiques positives, définies à 
un facteur constant près, au demi-plan Im 
T > 0 ; la réduction de Minkowski donne 
alors le domaine fondamental classique 
défini par T > 1 et Re T ^ 1/2 et repré- 
senté par la figure. 


Formes « indéfinies » 

Si Q est une forme quadratique de signa- 
ture (/?, q) avec p + q = r Qtpq ^ 0, on ne 
peut plus poser !e problème de !a q réduc- 
tion » comme pour les formes positives. 
En effet, le groupe orthogonal O(Q), 



Le domaine fondamental classique de la fonction 
modulaire 
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sous-groupe de GL(r, R) laissant Q inva- 
riante, est ici tel que O(Q) P 1 SL(aî, Z) soit 
infini , et la propriété de finitude de Siegel 
ne peut donc être vérifiée pour aucun 
ensemble (g non vide. La notion de 
« réduction » qu’il faut introduire ici est 
une découverte célèbre d’Hermite. On 
ordonne l’ensemble J£ des formes quadra- 
tiques positives non dégénérées par la 
condition que Qj ^ Q ? signifie que 
Q 2 — Q| G JC ; pour une forme quadrati- 
que indéfinie donnée Q, on appelle majo- 
rante d’Hermite de Q une forme Q’ G JC 
telle que Q(s) ^ Q’(x) pour tout x G R r 
qui est minimale dans l’ensemble des 
formes de JC ayant cette propriété. Si 
JC(Q) est l’ensemble des majorantes d’Her- 
mite de Q, alors Se(Q) est encore un espace 
symétrique K C G, avec G = O(Q) et K 
sous-groupe compact maximal isomorphe 
à 0(p) X O(q). La forme Q est alors dite 
réduite au sens d’Hermite si l’intersection 
de X(Q) et d’un domaine de Siegel <g' dans 
JC n’est pas vide, ou encore si Q est l’image 
par des opérateurs appartenant à un 
domaine de Siegel (g dans G de la forme 
canonique : 

tï+«+... + e;-e, J +l -..— y +fS 

le théorème de finitude fondamental est 
que, pour tout Q > 0 dans R, l’ensemble 
des formes réduites dont la matrice est de 
la forme aX, où X a ses éléments entiers, 
est un ensemble@. 

Ces résultats ont été considérablement 
généralisés au cours de ces dernières 
années. On y remplace GL(r, R) par le 
groupe des points réels G R , d’un groupe 
algébrique réductif G défini sur Q et T par 
un sous-groupe « arithmétique » de G : le 
problème fondamental est l’étude de 
l’espace homogène G R /F, et notamment 
l’obtention de critères pour que cet espace 


soit compact, ou de volume fini, ainsi que 
la preuve d’existence de « domaines fon- 
damentaux » ayant des propriétés de fini- 
tude généralisant celles qui sont décrites 
ci-dessus (A. Borel-Harish-Chandra). 

4. Formes quadratiques sur Z n 

On se borne aux formes quadratiques sur 
Z n non dégénérées, qui s’écrivent sous la 
forme Q : x i— ► B(x, x), où B est une forme 
bilinéaire sur Z" XZ” à valeurs dans Z ; la 
forme bilinéaire associée à Q est donc 2 B, 
et ce qu’on appelle la matrice de Q est ici 
la matrice de B (et non celle de 2 B) par 
rapport à la base canonique de Z" ; c’est 
par suite une matrice symétrique non 
dégénérée arbitraire à coefficients entiers, 
Le problème fondamental est l’étude de 
l’équation (3), où 7j et 72 , sont deux telles 
matrices, d’ordres respectifs tl et m ^ n, et 
où la matrice inconnue X est une matrice 
de type (, m , n) à coefficients entiers. Pour 
m = n, les matrices T 2 pour lesquelles (3) 
a une solution constituent la classe de 7j. 

Une autre manière de présenter l’étude 
des formes quadratiques sur Z n est de 
considérer une forme quadratique non 
dégénérée fixe sur R". Si B est la forme 
bilinéaire symétrique associée, on consi- 
dère les réseaux E dans R", à savoir les 
Z-modules de type fini engendrant 
l’espace R", tels que B(x, y) soit entier 
pour x et y dans E ; deux tels réseaux sont 
isomorphes s’ils se déduisent l’un de l’autre 
par une transformation orthogonale (pour 
B). Comme tout réseau est un Z-module 
libre (donc isomorphe à Z"), les diverses 
bases de E correspondent aux formes 
quadratiques sur Z rt formant une classe 
d’équivalence . L’avantage de cette présen- 
tation est qu’elle s’étend au cas où l’on 
remplace Z par l’anneau des entiers d’un 
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corps de nombres algébriques ; les réseaux 
sur un tel anneau ne sont plus nécessaire- 
ment des modules libres. 

Dans l’étude des formes quadratiques 
sur Z", on est amené à chercher à étendre 
le « principe de Hasse » de la théorie des 
formes quadratiques sur QL Les matri- 
ces X à coefficients entiers figurant dans 
l’équation (3) peuvent être considérées 
comme ayant leurs éléments dans l’un 
quelconque des anneaux d’entiers 
p-adiques Z p , ou dans R, et l’existence de 
solutions X à coefficients entiers implique 
donc celle de solutions X dans chacun de 
ces anneaux. Mais, ici, la réciproque n’est 
plus exacte ; les formes quadratiques 
JC 2 -f~ 55 y 2 et 5x 2 H- 1 1>’ 2 sont équivalentes 
dans R et dans tous les Z^, mais non dans 
Z (la première représente 1. mais non la 
seconde). On est donc amené à envisager 
une notion d’équivalence moins stricte que 
celle qui est définie ci-dessus : deux matri- 
ces symétriques non dégénérées 7| et 7^ 
correspondant à des formes quadratiques 
sur Z n sont dites appartenir au même genre 
si l’équation (3) a, dans chaque Z p , une 
solution X p (dépendant de p) ainsi qu’une 
solution dans R (ce qui signifie que les 
formes quadratiques correspondantes ont 
même indice). On déduit de la théorie de 
la réduction qu’un genre ne contient qu’un 
nombre fini de classes. 

L’étude approfondie de l’équation (3) 
dans Z repose sur des méthodes analyti- 
ques, OÙ la formule sommatoire de Poisson 
(cf. distributions, chcip. 4) joue un rôle 
prépondérant. Il y a lieu de distinguer le 
cas des formes positives du cas des formes 
« indéfinies ». 

Formes positives 

Si S et 7 sont des matrices symétriques 
correspondant à des formes positives non 
dégénérées sur Z", d’ordres respectifs n et 


m, avec m ^ n, on note N(S, 7) le nombre 
de solutions en matrices X sur Z de 
l’équation X'S'X = 7”, nombre qui est fini 
et ne dépend que des classes de S et de T. 
On ne connaît pas de formule donnant ce 
nombre pour n et m quelconques, mais 
Siegel en a obtenu une expression 
« moyenne » qui fait intervenir non seule- 
ment la classe de S, mais toutes les classes 
du genre de S. Désignant par S, des 
représentants de ces classes, on pose : 


(?) 


M(5, T) = 


N(S, T) 
N (S, S)’ 


et la formule de Siegel s’écrit : 

(8) T) = ï(5) JJ a AS, T), 

1 

où y(*S) est la « masse » du genre de S au 
sens d’Eisenstein-Minkowski, c’est-à-dire 
le nombre : 



somme des inverses des ordres des groupes 
d’automorphismes de Sj. Au second mem- 
bre de (8), V parcourt l’ensemble des « pla- 
ces » (finies ou non) de Q , et a v (S, 7), qui ne 
dépend que des genres de S et de 7, 
« mesure » en un certain sens l’ensemble 
des solutions de l’équation ! X.S,X = Tdans 
Qv. On a, d’autre part, une formule expli- 
cite (remontant à Minkowski) pour ^(S) : 

(9) Y(5)J| a, (S, 5) 

= 2 1 "{è) r (i)- r (|)= < detS ) < ” +1)/2 ' 

Ttn(n + l)/4 

ce qui permet, en faisant T — S dans (8), 
d’obtenir le nombre de classes dans le 
genre de S. 

La formule (8) pour T — S a une inter- 
prétation remarquable dans la théorie des 
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groupes « adéliques ». Si A est le groupe 
des adèles de Q (cf. théorie des NOMBRES " 
Nombres algébriques), on note Gq, G^ et 
G A les groupes des matrices carrées X 
à coefficients dans Q, et A respective- 
ment vérifiant les relations det(A) = 1 et 
'X.S.X= S. On définit un sous-groupe 
ouvert Go de G A comme produit : 

où v parcourt l’ensemble des places de Q, 
où G 0 (v) = G^ lorsque p = oo est la place 
à l’infini et où, pour chaque nombre 
premier p, l’ensemble Gq (;?) est l’ensemble 
des matrices de G /; à coefficients entiers 
yadiques. 

On voit alors que les classes du genre de 
S correspondent biunivoquement aux ~OU- 
I&s classes de G A suivant les sous-groupes 
Gq et Gq : si U f sont des représentants de 
ces doubles classes, de sorte que G A est la 
réunion des Gq£/,Gq, on désigne par R^, 
pour chaque nombre premier /?, le trans- 
formé dans Q" du réseau Z! p par l’automor- 
phisme (U, [ ) p , projection de Uj~ ] sur G,,. Il 
y a alors un réseau et un seul dans Q' 7 
dont l’adhérence dans Q” est R p ^ pour tout 
p ; la matrice Sj est celle qui correspond à la 
forme quadratique lorsqu’on prend pour 
base de Q" une base (sur Z) du réseau Rù\ 

On peut définir sur G A une mesure de 
Haar privilégiée m (cf. analyse harmoni- 
que, chap. 4), dite mesure de Tamagawa, 
coïncidant dans Gq avec le produit de 
mesures de Haar m v sur les G,.. Soit alors 
Gy( Uj) le sous-groupe discret de G,, pro- 
jection du groupe (U^ l G ü Uj) H Gq ; des 
raisonnements élémentaires de la théorie 
de la mesure de Haar donnent la relation : 

(10) m (G a /Gq) = 

(n-^XE m.(G ÎC /G 0 (^))j, 

p j 


où, par abus de langage, les mesures de 
Haar m et m x sur des quotients de G A ou 
de G x par des groupes discrets sont celles 
qui sont déduites canoniquement des 
mesures notées m et m x sur G A et G,. On 
constate alors que cette formule devient 
identique à la formule de Siegel (8) pour 
T = S, une fois que l’on a prouvé que le 
« nombre de Tamagawa » m( G a /Gq) est 
égal à 2 ; la preuve de ce fait (qui peut se 
faire indépendamment des résultats de 
Siegel) nécessite le même genre de métho- 
des analytiques. On peut aussi obtenir de 
cette manière la formule générale (8) pour 
n ^ 4 et ni ^ U — 3. En outre, cette 
méthode d’« adélisation » peut être consi- 
dérablement généralisée en remplaçant G 
par un groupe algébrique semi-simple 
défini sur Q et en considérant des SOUS- 
groupes « arithmétiques » convenables de 
G (Tamagawa, A. Weil, T. Ono). 

Formes indéfinies 

Les développements précédents subsistent 
sans modification lorsqu’on remplace G 
par le groupe analogue correspondant à la 
matrice S d’une forme indéfinie à coeffi- 
cients entiers ; mais, comme ici les nom- 
bres N(S, 7) sont infinis, il n’est plus 
possible d’interpréter la formule (10) et 
l’analogue pour T =£ S de la même 
manière que pour les formes positives ; 
Siegel a montré comment le faire en 
interprétant, dans la formule (8), les nom- 
bres T) comme des volumes de 

domaines fondamentaux pour certains 
groupes discontinus ou comme des limites 
de rapports de nombres de solutions 
comme dans (7), où l’on impose aux 
solutions d’être dans un domaine borné de 
ZJ nn et où l’on fait ensuite tendre ce 
domaine vers l’espace tout entier. 

Donnons un exemple de ce genre 
d’interprétation qui précise le théorème de 
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Meyer affirmant qu’une forme quadrati- 
que indéfinie à coefficients entiers et à cinq 
variables au moins a toujours des solutions 
non triviales. Si : 

n 

Q( X ) = n > 5 

h = i 

est une forme indéfinie à coefficients 
entiers, si : 

Qo(*) = 

k ~ 1 

est une majorante d’Hermite de cette 
forme et si on pose : 

A(e) = 6 Qo (* ) , e > 0 

X 

X parcourant l’ensemble infini des solu- 
tions de Q(x) = 0, alors cette série est 
convergente et, lorsque e tend vers 0, le 
nombre A(e) croît indéfiniment et est 
équivalent à Ce l) ' 2 , où C est une 
constante. 

À d’autres égards, les formes indéfinies 
ont une théorie plus simple que les formes 
positives : le nombre des classes d’un genre 
est toujours une puissance de 2 (qui peut 
être arbitrairement grande), et les nombres 
JU y (5, 7) pour les classes d’un même genre 
sont tous égaux , ce qui donne leur valeur 
en vertu de la formule de Siegel lorsqu’on 
connaît le nombre de classes du genre. 
Dans certains cas, on a même une classi- 
fication complète des réseaux correspon- 
dant aux formes quadratiques indéfinies : 
il en est ainsi pour les formes sur Z” de 
déterminant ± 1 . On les classe en deux 
types suivant que la forme quadratique ne 
prend que des valeurs paires (type 2) ou 
prend aussi des valeurs impaires (type 1). 
Les réseaux de type i sont isomorphes à 
pl+ © où I + (resp. I_) correspond à la 
forme quadratique x 2 (resp. x 2 ) sur Z et 


où p et q sont des entiers ^1 ; les réseaux 
de type 2 sont isomorphes à ± (/>U © ^r 8 ), 
avec p & q entiers ) 0, où U correspond 
à la forme quadratique 2 XjX 2 sur Z 2 . Pour 
n — 4k, r„ est le réseau dans Q' ? formé des 
(,Y y ), 1 ^ j ^ fl , tels que 2 Xj etX,— Xj soient 
entiers pour tous les indices, et que 
l’entier : 



soit pair, la forme bilinéaire fixe prise sur 
Q" étant : 

) = i 

on vérifie que la forme quadratique posi- 
tive sur Z n définie par est à coefficients 
entiers et ne prend que des valeurs paires 
si k est pair. 


5. Formes quadratiques 
et fonctions modulaires 

Lorsqu’on fait m = 1 dans la formule de 
Siegel (8), de sorte que Test réduite à un 
seul entier N, on obtient une « valeur 
moyenne » du nombre de solutions de 
l’équation Q(s) =: N dans Z n pour une 
forme positive Q sur Z" ; si l’on sait que le 
genre de S ne contient qu’une seule classe, 
ou si les nombres N(S„ T) sont les mêmes 
pour toutes les classes du genre de S, la 
formule (8) donne le nombre de solutions 
de Q(x) = N pour tout N. Par exemple, si : 

q(*) = 

on sait depuis Eisenstein que ie genre de S 
n’a qu’une seule classe pour n ^ 8, mais ce 
n’est plus exact pour 17 ^ 9 ; pour n = 16, 
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il y a deux classes dans le genre, mais elles 
donnent la même valeur à N (Sp 7). On 
déduit donc de la formule de Siegel (8) des 
expressions exactes pour le nombre de 
représentations de N comme somme de ri 
carrés pour n ^ 8 ou n = 16. 

La théorie des fonctions thêta et des 
formes modulaires donne des expressions 
remarquables pour le second membre de 
(8) pour m = 1. Soit Q(s) une forme 
quadratique positive non dégénérée sur Z n 
et soit S sa matrice ; la série : 

(11) Q s (z) = ^ exp(7hQ(x )z), 

X 

où X parcourt Z f \ est absolument conver- 
gente pour Im z > 0 et est donc une 
fonction holomorphe de z dans ce demi- 
plan. La formule sommatoire de Poisson 
permet de prouver l’identité de Jacobi 
générale : 

(12) 0,(0 = ((-izy dets^e^-t) 

Bornons-nous, pour simplifier, au cas 
où det (S) = 1 et où les termes diagonaux 
de S sont pairs ; on montre que cela 
implique que n est un multiple de 8 ; la 
relation (12) s’écrit alors : 

6 S (— j) =z" /î Ô.,(z), 

et d’autre part : 

e,(z + 1) = e,(z). 

Or, dans le demi-plan supérieur 
Im z > 0, les transformations z 1 — ¥ Z-\- 1 et 
Z 1 — *■ 1 /z engendrent le groupe modulaire 
de toutes les transformations : 

az + b 

Z ► T .y 

cz + d 

avec a, b , c, dentiers et ud — hc — 1 ; c’est 
un groupe discontinu dont un domaine 


fondamental est donné par la figure. Une 
forme modulaire de poids 2 k, pour k 
entier, est une fonctionfholomorphe dans 
Im z > 0 telle que : 

f(2)={CZ + d)^f{ a ^±±\ 

pour toute transformation du groupe 
modulaire ; en outre, on impose à f la 
condition d’être holomorphe à l’infini, ce 
qui implique qu’elle est développable en 
série : 

/(O — 

N = 0 

convergente pour Im Z > 0 ; on dit de plus 
que la forme est parabolique si üq = 0. La 
fonction 0 v est donc une forme modulaire 
de poids nj 2. 

Si k > 1, la série d’Eisenstein : 

(13) G*(z) = (« + d)-™, 

M 

où (c*, d) parcourt Z 2 — {0}, est conver- 
gente (cas particulier d’une série de Poin- 
caré pour le groupe modulaire) et est une 
forme modulaire de poids 2 k , telle que 
G^(oo) = 2 Ç(2&) ; en posant q = e 2m: , on 
montre que : 

G* (O =2 t(2*)E*fc) f 

avec : 

<x 

(14) E*( ? ) = 1 + 

où est le k-ième nombre de Bernoulli 
et a u _|(N) la somme des puissances 
(2 k- l)-ièmes des diviseurs de N (cf. 
calculs asymptotiques, chap. 2). 

On montre alors que l’on a 

0 y = Efc + f s où k = n/4 et où f s est une 
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forme modulaire parabolique. Comme 
l’on peut écrire : 

(15) 0,(?)= ^r s (N)? N , 

N = 0 

où v,(N) est le nombre de solutions de 
l’équation Q(s) = 2 N dans Z", on déduit 
de (14) l’expression asymptotique : 

4 v 

(16) r s(N) = — a u _, (N) + 0(N*). 

Pour n = 8 ou n — 16, on a f s = 0 ; 
pour n = 24, on montre que/ v = C- s F, où 
F est la forme parabolique : 

» 

p(ç) n o — ? n ) 24 * 

N = 1 

étroitement liée à la théorie des fonctions 
elliptiques, et c une constante dépendant 
de la classe de S et qu’on détermine en 
évaluant le coefficient r s ( 1) ; on montre, 
pour n = 24. qu’il y a vingt-quatre classes 
de formes quadratiques vérifiant les condi- 
tions indiquées ci-dessus. Siegel a montré 
que, pour m = 1, la matrice T étant 
réduite à l’entier N, la série génératrice 
dont le coefficient de q N est le premier 
membre de la formule (8) s’exprime encore 
à l’aide de séries d’Eisenstein. lia ensuite 
étendu ce fait au cas où m est quelconque, 
en introduisant des « fonctions modulaires 
d’ordre m », où le demi-plan Im : > 0 est 
remplacé par le « demi-espace de Siegel » 
formé des matrices symétriques complexes 
d’ordre m, dont les parties imaginaires 
sont des matrices positives non dégéné- 
rées ; le groupe modulaire est remplacé par 
le groupe de transformations : 

Z «-► (AZ + B)(CZ + D)~ l 

Hn Hpmi_pcna 1 a matrix • 

VIU V4V1111 vopuwv IU UlUlilVL . 



d’ordre 2 m parcourant le groupe symplec- 
tique Sp (2 m , Z) sur Z ; la notion de série 
d’Eisenstein se généralise et permet d’éten- 
dre les formules précédentes. 

JEAN DIEUDONNÉ 


Bibliographie 

A. Borel, Introduction aux groupes arithmétiques, 
Hermann, Paris, 1969 / J. W. Cassels, Rational 
Quadratic Forms , Acad. Press, New York, 1979 / 
M. Kneser, « Klassenzahlen definiter quadratischer 
Formen », in Archiv der Mathematik , n ( ’ 8, 1957 / 
0 . T. O’Meara, Introduction to Quadratic Forms , 
Springer Verlag, New York-Berlin, 3’ éd., 1973 / 
J.-P. Serre, Cours d arithmétique, P. U, F,, Paris, 
1970 / C. L. Siegel, Gesammelte Ahhandlungen , 
3 vol.. Berlin. 1966 / A. Weil. Sur lu théorie des 
formes quadratiques , Bruxelles, 1962 / « Sur la for- 
mule de Siegel dans la théorie des groupes classi- 
ques », in Acta mathematica,n° 113, 1965 / E. Witt, 
« Théorie der quadratischen Formen in beliebigen 
Kôrpern », in Journal de Crelle , n° 176, 1937. 


QUADRIQUES 


L es surfaces de l’espace matériel, que 
nous connaissons par leur emploi, en 
architecture par exemple, étaient autrefois 
classées en « corps ronds » et « corps 
droits ». La sphère et le cube sont des 
surfaces typiques de ces deux familles. 

Les corps ronds sont, essentiellement, 
la sphère déjà citée, le cylindre et le cône 
usuels (fig. 1). Étudiées individuellement, 
ces surfaces semblent n’avoir que peu de 
points communs : l’une est bornée, les deux 
autres ne le sont pas. Le cône possède un 
point remarquable (son sommet), alors 
que ie cylindre est totalement homogène. 
Il est toutefois bien connu que les inter- 
sections de ces trois surfaces par des plans 
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xi 

O 


sont toujours des coniques, éventuellement 
dégénérées en couples de droites. L’adjec- 
tif conique, c’est-à-dire dessiné sur un 
cône, est à l’origine du nom donné à ces 
courbes (cf. coniques). 

Les propriétés très remarquables des 
coniques, qui constituent l’ensemble le 
plus riche de courbes simples, avaient 


conduit les Grecs à unifier partiellement 
les définitions et les démonstrations pro- 
pres à chacune d’elles (ellipse, parabole et 
hyperbole). Seule la géométrie analytique 
cartésienne, pourtant, a permis de donner 
des coniques la définition essentielle : ce 
sont les courbes algébriques du second 
ordre, c’est-à-dire les ensembles de points 


dont les coordonnées (a*, y) satisfont à une 
égalité de la forme : 

IW)= °- 

où P est un polynôme non nul du second 
degré. Suivant la nature des nombres x et 
y (qui sont réels ou complexes), on définit 
plusieurs types de coniques. 
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La généralisation de cette notion à 
l’espace de dimension trois est alors évi- 
dente. Les surfaces ainsi définies sont 
appelées quadriques. Leurs sections planes 
sont des coniques ; et cela les caractérise 
évidemment parmi les surfaces algébri- 
ques. 


1. Cadre naturel de la théorie 

Extensions diverses 

Une quadrique est un ensemble de points 
satisfaisant à une égalité de la forme 
suivante où l’un au moins des six premiers 
coefficients n’est pas nul : 

ax 2 + a 'y 2 + a "z 2 + 2 byz + 2 b ’xz + 2 b "xy 
+ 2 ex + 2 c'y + 2 c"z +d — 0; 

par exemple, une sphère (dont le centre a 
pour coordonnées w, v et w) a une équation 
du type : 

x 2 + y 2 z 2 — 2 ux — 2 vy — 2 wz 

+ (w 2 + v 2 + w 2 — r 2 ) = 0. 

Certaines complications dans la théorie 
de ces surfaces conduisirent les mathéma- 
ticiens du XIX e siècle à étendre, dans deux 
directions différentes, la notion de quadri- 
que et des autres surfaces algébriques. Non 
seulement ils firent un usage systématique 
des coordonnées complexes, enrichissant 
ainsi considérablement le modèle mathé- 
matique issu des corps de l’espace maté- 
riel, mais ils élargirent le concept de point 
en considérant des « éléments à l’infini » 
par hintroduction d’une quatrième 
coordonnée t, nulle pour les nouveaux 
points. 


Pour ces géomètres, une quadrique 
était donc finalement déterminée par une 
équation de la forme : 

ax 1 + a y 2 + a "z 2 + 2 byz + 2 b ’xz + 2 b "xy 
+ 2 ext + 2c'yt + 2 c "zt + dt 2 = 0. 

Les « points » de ces quadriques sont, 
en réalité, non des points d’un espace 
classique (dit affine , de dimension trois sur 
le corps des nombres réels), mais des 
droites d’un espace vectoriel de dimension 
quatre sur le corps des nombres comple- 
xes. L’ensemble de ces droites, c’est-à-dire 
des sous-espaces vectoriels de dimension 1, 
est appelé le projectifié complexifié de 
l’espace usuel. 

Cette extension donna une grande unité 
aux théorèmes : ainsi, une droite arbitraire 
coupe toujours une quadrique en un point 
au moins. Dans ce cadre, une théorie fort 
élégante de la polarité, directement géné- 
ralisée à partir de considérations analogues 
sur les coniques, conduit à un grand 
nombre de propriétés (sur les plans tan- 
gents, par exemple), pour lesquelles on 
n’est plus tenu de distinguer un grand 
nombre de cas. 

Quadriques et formes quadratiques 

Ce passage d’un espace affine à un espace 
projectif - au prix d’une augmentation 
de la dimension - permit surtout de placer 
la théorie des quadriques dans son véri- 
table cadre : celui des formes quadratiques. 
Conformément à une tendance actuelle, 
l’étude détaillée des coniques et des qua- 
driques est aujourd’hui délaissée au profit 
de la notion plus générale d ' hyperquadri- 
que , définie comme un ensemble de- 
droites vectorielles d’un espace E sur 
un corps algébriquement clos de caracté- 
ristique différente de deux ; une droite 
appartient à cet ensemble si et seulement 
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si les vecteurs qui la composent annulent 
une forme quadratique non nulle q. L’éga- 
lité : 

q(Y) =0 

est une équation de l’hyperquadrique. 

Cette généralisation est parfaitement 
typique de l’algébrisation d’une théorie 
géométrique ; en quelques pages, toutes les 
notions de conjugaison et leurs cas parti- 
culiers (hyperplans tangents ou symétries 
centrales, par exemple) peuvent être étu- 
diés comme applications de la théorie de la 
conjugaison de vecteurs par rapport à la 
forme q. 

Donnons un exemple : pour que deux 
points donnés, associés à deux vecteurs 
v et v' de l’espace E, forment une division 
harmonique avec deux points de l’hyper- 
quadrique, il est nécessaire - et suffisant en 
général - que l’on ait l’égalité : 

q(v + v ') = q(v ) -j- q(v'). 

Dans le cas particulier évidemment 
très utile - où l’espace E est de dimension 
finie, le calcul matriciel permet une tra- 
duction souple des calculs analytiques. 
C’est ainsi que l’équation d’une quadrique 
classique peut s’écrire : 

<X.A.X = 0, 

où X est la matrice colonne composée des 
quatre nombres x, y, z et t ; { X est la matrice 
ligne transposée de la précédente, et A une 
matrice symétrique réelle : 

( a b " b' c \ 

b* a' b c' I 

b’ b a " c" I 

c c' c" d J 

Une quadrique est dite propre si la 
forme quadratique associée q est non 
dégénérée, ce qui se traduit par le fait que 


le déterminant A = det A de la matrice A 
est non nul. Si A = 0, la quadratique est 
dite impropre. 


2. Quadriques impropres 

Il existe onze types différents de quadri- 
ques impropres, parmi lesquels on distin- 
gue trois familles principales : les cônes, les 
cylindres et les quadriques décomposées. 

Cônes 

Les cônes sont obtenus à partir d’un 
sommet et d’une base, conique non décom- 
posée dont le plan ne contient pas le 
sommet. Le cône de révolution est l’un 
d’eux ; on peut l’engendrer par rotation 
d’une droite autour d’une droite fixe 
qu’elle rencontre : un cône est constitué de 
deux nappes, c’est-à-dire de deux parties 
symétriques limitant des volumes convexes 
et reliées entre elles par le sommet com- 
mun (fig. 2). 

Le sommet d’un cône est toujours réel. 
C’est le seul point de cette espèce si la 
conique de base est totalement non réelle ; 
le cône est alors dit imaginaire. Sinon, le 
cône est réel, et la nature de la conique de 
départ est sans importance. 

Cylindres 

Les cylindres sont des cônes dont le som- 
met est « à l’infini » : ils sont donc obtenus 
par des droites (génératrices) ayant une 
direction donnée qui rencontrent une coni- 
que non décomposée dont le plan n’est pas 
parallèle à la direction. Là aussi, le cylindre 
de révolution (qui sert de base à tant 
d’éléments architecturaux) en est l’exem- 
ple le plus simple. 

Suivant que la conique est non réelle, ou 
une ellipse, ou une hyperbole, ou une 
parabole, le cylindre est dit imaginaire, 
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fig. 2 



Deux aspects d'un cône réel. 


elliptique, hyperbolique ou parabolique 
(fig. 3). Le cylindre de révolution est un cas 
particulier de cylindre elliptique. Les 
sections planes sont, en général, des coni- 
ques de même genre que la conique de 
base. 

Quadriques décomposées 

Les couples de plans sont des quadriques à 
la fois impropres et décomposées ; ce der- 
nier qualificatif signifie simplement qu’il 
s’agit alors de la réunion de surfaces 
algébriques d’ordre inférieur à celui de la 
quadrique : ce sont donc des plans. Il en 
existe cinq sortes, selon que les deux plans 
sont réels et sécants, réels et parallèles, non 
totalement réels (mais transformés l’un en 
l’autre par une conjugaison des coordon- 
nées) et sécants, non réels et parallèles, ou 
réels et confondus. 

ruui qu une quadrique soit décompo- 
sée, il est nécessaire et suffisant que l’on 
puisse écrire l’égalité : 


a b" b' 


a b' c 


a b" c 


a'b c' 

b" a' b 
b' b a” 

+ 

b'a"c" 
c c"d 

+ 

b" a' c' 
c c' d 

+ 

b a "c” 
c'c "d 


et que la quadrique soit impropre. Pour 
qu’elle soit décomposée en un plan double, 
il s’introduit une condition supplémen- 
taire : l’ensemble des deux premières 
conditions est équivalent au fait que 0 doit 
être une valeur propre au moins double de 
la matrice A ; la troisième condition 
entraîne que 0 est alors une valeur propre 
au moins triple. 


3. Quadriques propres 

Les quadriques propres présentent moins 
de variété. Elles se classent également en 
trois ÇorniVics (ellipsoïdes, hyper iWuîuL^ et 
paraboloïdes) ayant chacune deux SOUS- 
familles. 
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Ellipsoïdes 

Les ellipsoïdes (fig. 4), par un changement 
d’axes approprié, peuvent se mettre sous 
la forme : 



où a, b et c sont des nombres réels et 


strictement positifs. Le signe moins cor- 
respond à un ellipsoïde imaginaire, dont 
aucun point n’a toutes ses coordonnées 
réelles. Le signe plus correspond à l’ellip- 
soïde classique dont la partie réelle équi- 
vaut, grosso modo, à une sphère, surface 
en laquelle on peut le transformer par des 
affinités appropriées (de la même façon 


que l’on transforme une ellipse réelle en un 
cercle). Il est de révolution si deux des 
nombres a. b et c (b et c, par exemple) sont 
égaux; on le qualifie de sphérique si 
a — b ~ r d’ aplati si a < b ~c\ 
d’allongé si ü > b = c. 

Les sections planes d’un ellipsoïde sont 
en général des ellipses, réelles ou non. 
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fig. 4 



Ellipsoïde. 


Hyperboloïdes 

Les hyperboloïdes ont une équation que 
l’on peut mettre sous l’une des deux formes 
suivantes : 


(H.) 

m 



Le premier cas est celui de Y hyperbo- 
loïde à une nappe (fig. 5), qui est une 
surface connexe évoquant la forme d’une 
bobine. On peut le considérer, de deux 


fig. 5 



Hyperboloïde à ‘‘ne nappe. 


façons différentes, comme réunion d‘une 
famille de droites, les génératrices. Une 
affinité convenable, qui revient a égaler les 
coefficients a et /}, le transforme en hyper- 
boloïde de révolution, engendré par la 
rotation d’une droite autour d’une droite 
qu’elle ne rencontre pas. 

Les sections planes sont des coniques 
de toutes espèces ; un plan tangent coupe 
l’ hyperboloïde suivant deux droites sécan- 
tes, qui le séparent en deux parties situées 
de chaque côté de ce plan. 

Le second cas est celui de Y hyperboloïde 
à deux nappes (fig. 6). qui admet deux 


fig. 6 




Hyperboloïde à deux nappes. 
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nappes disjointes, connexes, limitant deux 
volumes convexes. Les génératrices d’une 
telle surface ne sont pas réelles, sauf 
éventuellement en leur point commun. 

Paraboloïdes 

Les paraboloïdes ont une équation que 
l’on peut mettre sous la forme : 



où p et q sont deux nombres réels non nuis. 

Si p et g sont de même signe, le 
paraboloïde est elliptique (fig. 7), de révo- 

I" fig- 7 I 



Paraboloïde elliptique. 


lution si p = (J. Une affinité convenable 
peut toujours mettre le paraboloïde sous 
cette forme ; la surface résulte alors de la 
rotation d’une parabole autour de son axe. 

Les sections planes sont des paraboles 
ou des ellipses. Dans le cas d’un parabo- 
loïde de révolution, une section plane se 
projette sur un plan orthogonal à l’axe 
suivant une droite ou un cercle. 

Si p et q sont de signes différents, le 
paraboioïde est hyperbolique (fig. 8). C’est 
une surface assez remarquable, dont la 
forme évoque celle d’une selle de cheval. 



Une quadrique propre possède, comme 
nous l’avons vu à propos de l’hyperboloïde 
à une nappe, un double système de 
génératrices, Dans le cas du paraboloïde 
hyperbolique, les génératrices passant par 
un point réel sont réelles ; elles séparent la 
surface en deux parties situées de part et 
d’autre du plan tangent. Les sections 
planes sont des paraboles ou des hyper- 
boles. 

Le paraboloïde hyperbolique possède 
de nombreuses définitions géométriques 
très simples. Citons-en deux : 

Si Ton se donne trois droites soumises à 
la seule condition d’être parallèles à un 
même plan, une droite variable qui ren- 
contre ces trois droites engendre un para- 
boloïde hyperbolique ; 

“ Si l’on se donne deux droites quelcon- 
ques, une droite variable qui les rencontre 
toutes les deux et reste parallèle à un plan 
donné engendre un paraboloïde hyperbo- 
lique. 

Les plans apparaissant dans l’une ou 
l’autre de ces définitions sont appelés 
plans directeurs de la surface. 11 en existe 
deux, définis chacun à une translation 
près. 
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Les ellipsoïdes et les hyperboloïdes ont, 
à la fois, un centre et des plans de symétrie. 
Les paraboloïdes n’ont que des plans de 
symétrie. 


4. Problèmes tangentiels 

Les dix- sept variétés de quadriques don- 
nent une idée assez complète des différen- 
tes formes que peuvent prendre les surfa- 
ces de l’espace usuel. Paraboloïde 
hyperbolique et hyperboloïde à une nappe 
fournissent des exemples très simples de 
surfaces qui traversent leurs plans tangents 
(ce qui n’est pas le cas de la sphère ou du 
cylindre de révolution, par exemple). 

Une étude assez simple, fondée sur la 
théorie des valeurs et des vecteurs propres 
d’une matrice réelle symétrique, permet de 
déterminer les plans qui coupent une 
quadrique suivant des cercles. Ces plans 
sont parallèles entre eux (on se limite à des 
plans réels). Certains plans limites sont 
tangents à la surface en des points appelés 
ombilics. Il y en a deux pour un ellipsoïde 
réel non sphérique, deux pour un hyper- 
boloïde à une nappe, deux pour un para- 
boloïde elliptique. Il existe des cas parti- 
culiers ; par exemple, tous les points d’une 
sphère sont des ombilics. 

Les quadriques propres sont non seu- 
lement des ensembles de points soumis à 
des conditions du second degré, mais aussi 
des enveloppes de plans dont les paramè- 
tres annulent un polynôme homogène du 
second degré, autre forme quadratique 
attachée à la surface. Aussi dit-on que ces 
quadriques sont des enveloppes de seconde 
classe. Un cône, par exemple, ne répond 
pas à cette définition, car il possède deux 
équations tangentieiies au iieu d’une. 

Les quadriques généralisent donc étroi- 
tement les propriétés affines et projectives 


des coniques (cf. coniques). Il faut noter 
toutefois que, hormis les quadriques de 
révolution, obtenues par simple rotation 
d’une conique autour d’un axe, il n’existe 
pas de concept analogue à ceux de foyers 
et de directrices pour les coniques. Ces 
notions métriques sont donc directement 
liées à la structure particulière du plan. 
Sans doute cela provient-il, comme pour la 
plupart des résultats non généralisables si 
la dimension de l’espace excède deux, de la 
structure des rotations planes dont le 
groupe cesse d’être commutatif lorsque la 
dimension passe de deux à trois. 

ANDRÉ WARUSFEL 
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SÉRIES & PRODUITS INFINIS 


L a notion de limite d’une suite est à la 
base de l’analyse. Le langage des 
séries, équivalent à celui des suites, s’est 
imposé dès le XVII e siècle à propos du 
développement des fonctions en série 
entière. Cependant, les fondements rigou- 
reux de la théorie des séries, reposant sur 
une définition des limites, remontent seu- 
lement au début du XIX e siècle, avec les 
travaux d’Abel, de Cauchy et de Gauss. 
L’étude des séries de nombres réels ou 
complexes et celle des séries de fonctions 
(séries entières, séries de Fourier, etc.) 
peuvent être considérées comme des cas 
particuliers de la théorie des séries d’élé- 
ments d’un espace vectoriel normé. On 
peut regrouper la notion de produit infini, 
utilisée par Euler au XVIII e siècle, avec celle 
de série, à condition de se placer dans le 
cadre des groupes topologiques séparés. 

Séries 

Soit G un groupe commutatif topologique 
séparé (cf. algèbre topologique), dont la 
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loi est notée additivement. On appelle série 
d’éléments de G un couple A = ((u n ), (s,)) 
constitué de deux suites d’éléments de G 
telles que, pour tout entier naturel n , on 
ait : 



m = 0 


l’élément s„ s’appelle somme à /‘ordre n , la 
suite (u„), terme général , et la suite (s n ), 
suite des sommes partielles de la série A. 

On dit que la série A est convergente ou 
divergente suivant que la suite (s n ) 
converge ou non. Lorsque la série A est 
convergente, la limite s de (s,) s’appelle 
somme de A et se note encore : 



dans ces conditions, pour tout entier natu- 
rel n, l’élément r n = s s„ s’appelle reste à 
l’ordre n et se note : 

+ °° 

2>~ 

m — n + 1 

Il est immédiat que, si la série A 
converge, son terme général tend vers 0. 
Examinons les liens entre suites et séries. 
Pour toute suite (u,) d’éléments de G, il 
existe une série A et une seule dont le terme 
général est (u„) ; sa somme à l’ordre n est 
définie par la relation (1). Inversement, 
pour toute suite (s„) d’éléments de G, il 
existe une série A et une seule dont la suite 
des sommes partielles est (s /} ) ; son terme 
général est défini par les relations : 

i / 0 = s 0 , 

U n = S n — S„_ 1 , n 7^0 

Ainsi, par définition, i’étude de ia 
convergence d’une série se ramène à celle 
d’une suite. Réciproquement, les règles 


de convergence des séries peuvent servir 
à étudier la convergence d’une suite 
par l’intermédiaire de la série des différen- 
ces. 

Le cas fondamental dans la théorie des 
séries est celui où G est le groupe SOUS- 
jacent à un espace vectoriel normé E. Les 
séries d’éléments de E constituent un 
espace vectoriel ; les séries convergentes 
constituent un sous-espace vectoriel de 
l’espace vectoriel précédent, et l’applica- 
tion qui à toute série convergente fait 
correspondre sa somme est linéaire. La 
multiplication de Cauchy des séries 
d’éléments d’une algèbre normée ne pré- 
sente d’intérêt que dans le cas des séries 
entières ; nous n’indiquerons ici que la 
multiplication des familles sommables 
(cf. infra). 

Lorsque l’espace vectoriel normé E est 
complet, le critère de convergence de Cau- 
chy prend la forme suivante : Pour qu’une 
série A = ((u,), (s,,)) converge, il faut et il 
suffit que, pour tout voisinage V de 0, il 
existe un entier naturel n () tel que, pour tout 
couple ( q , r) d’entiers naturels avec 
r > q ^ / 7 0 , on ait : 

Z— 

m=q 4-1 

tien avec les intégrales impropres 

Supposons toujours l’espace vectoriel 
normé E complet. L’étude de la conver- 
gence d’une intégrale impropre peut se 
ramener à celle d’une série, et réciproque- 
ment. Soit en effet f une application réglée 
(cf. CALCUL INFiNiTÉsiMAL-Calcul à une 
variable, chap. 3) de [0, oo[ dans E 
admettant 0 pour limite à l’infini, (a„) une 
suite strictement croissante de nombres 
réels positifs tendant vers + oo telle que 
a 0 = 0 et que la suite (a„ +1 — a„) soit 
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bornée, et enfin A la série dont le terme 
général est défini par la relation : 

k„ =£°” + /(<)<*; 

pour que l’intégrale impropre : 

f (t)dt 

converge, il faut et il suffit que la série A 
converge. 

Convergence des séries 

de nombres réels positifs 

Dans le cas des séries de nombres réels 
positifs, on peut obtenir des règles plus 
précises de convergences des séries, grâce 
au résultat fondamental suivant : Pour 
qu’une série A = ((il,), (s n )) de nombres 
réels positifs converge, il faut et il suffit que 
la suite (s,) soit majorée. Plus précisément, 
si cette suite est majorée, on a : 

; ™ 

n = 0 

si cette suite n’est pas majorée, s n tend vers 
-f- oo. 

Soit A et B deux séries de nombres réels 
positifs, de termes généraux ( u n ) et (v,). Si, 
pour tout entier naturel n, on a u n ^ v„ il 
découle du théorème ci-dessus que la 
convergence de la série B implique celle de 
la série A. Dans ce cas : 

« =0 n = 0 

Ce corollaire permet de ramener l’étude 
de la plupart des séries à celle de séries 
beaucoup plus simples, qui serviront alors 
de séries de référence pour les séries les 
plus générales. La convergence de ces 
séries de référence. s’ établit en les compa- 
rant à des intégrales impropres, ce qui 
montre l’importance du résultat que voici. 


Soitfune fonction réglée sur [0, -)- oo[ 
à valeurs réelles positives, décroissante et 
ayant 0 pour limite à l’infini, et A la série 
de terme général [f («)). Pour que la 
série A converge, il faut et il suffit que 
l’intégrale impropre : 

j>>* 

converge. 

On prend la plupart du temps pour 
séries de références les séries géométriques, 
c’est-àdire les séries dont le terme général 
est de la forme (a n ), les séries de Riemunn, 
de terme général (\jn a ), convergentes si et 
seulement si a > 1, les séries de Bertrand, 
de terme général : 

«(ln«) a ’ 

convergentes également si et seulement si 
a > 1. 

La comparaison directe des séries de 
nombres réels positifs s’effectue à l’aide de 
la règle suivante : soit A et B deux séries de 
nombres réels positifs, de termes généraux 
(u n ) et (vJ.Si (u n ) est dominée par (v,) et si, 
de plus, B converge, alors A converge. Il 
s’ensuit que, si ( u n ) et (v,) sont semblables, 
les séries A et B sont toutes deux conver- 
gentes ou toutes deux divergentes, 

En prenant pour série de référence une 
série géométrique ou bien une série de 
Riemann, on obtient les règles classiques 
que voici. 

Règle de Cauchy. Soit (u„) une suite de 
nombres réels positifs telle que V u n 
admette une limite (3. Si p < 1, la série de 
terme général ( u n ) converge ; si p > 1, 
cette série diverge. 

Règle de Riemunn. Soit (u,) une suite de 
nombres réels positifs telle qu’il existe un 
nombre réel a satisfaisant à la condition 
suivante : La suite n a u n admet une limite P 
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appartenant a [ 0 , oo[. Si a > 1 et si 
(3 < + oo, la série de terme général (u n ) 
converge ; si (X ^ 1 et si p 7E 0 , cette série 
diverge. 

La comparaison directe s’utilise sou- 
vent sous la variante suivante, appelée 
comparaison logarithmique : soit ( u n ) et 
(v #l ) deux suites de nombres réels stricte- 
ment positifs telles qu’a partir d’un certain 
rang on ait : 


n + 1 ^ ’ n + 1 , 

si la série de terme général (v n ) converge, 
il en est de même de la série de terme 
général (u„). 

En prenant toujours pour série de 
référence une série géométrique ou une 
série de Riemann, on obtient les deux 
autres règles classiques suivantes. 

Règle de D’Alembert. Soit (u„) une suite 
de nombres réels strictement positifs telle 
que u n +q'u n admette une limite p. Si 
P < 1, la série de terme général (u n ) 
converge : si p > 1, cette série diverge. 

Règle de Ruube-Duhamel. Soit (u,) une 
suite de nombres réels strictement positifs 
telle que u n +Ju t1 tende vers 1 par valeurs 
inférieures. On considère la suite (t„) 
définie par la relation : 

Un 

on suppose enfin que Yll n admet une limite 
P appartenant à [0, + oo[. Si p > 1, la série 
de terme général (u n ) converge ; si p < 1, 
cette série diverge. 

Convergence absolue 

et semi-convergence 

L’étude d’une série d’éléments d’un espace 
de Banach peut souvent se ramener à celle 
d’une série de nombres réels positifs, grâce 
à la notion suivante : On dit qu’une 


série A = ((w rt ), (s,,)) d’éléments d’un 
espace vectoriel normé E est absolument 
convergente si la série de terme général 
( || u n I ) est convergente. Pour que E soit 
complet, il faut et il suffit que toute série 
absolument convergente d’éléments de E 
soit convergente. En particulier, toute série 
absolument convergente de nombres com- 
plexes est convergente. 

Prenons par exemple pour E l’espace 
vectoriel des applications bornées sur un 
ensemble X à valeurs dans un espace de 
Banach F, et munissons E de la norme de 
la convergence uniforme. La convergence 
absolue au sens de cette norme est dite 
normale . Toute série normalement conver- 
gente d’éléments de E est uniformément 
convergente sur X et absolument conver- 
gente (au sens de la norme sur F) en tout 
point de X ; une telle série converge 
simplement sur X. On notera que toutes les 
réciproques sont fausses. 

L’étude des séries non nécessairement 
absolument convergentes est souvent faci- 
litée par la règle suivante. 

Règle d'Abel. Soit (a„) une suite décrois- 
sante de nombres réels positifs convergeant 
vers 0 et (a,) une suite d’éléments d’un 
espace de Banach E. S’il existe un nombre 
réel positif P tel que, pour tout couple (q, r) 
d’entiers naturels avec q < r, on ait : 


1 





P, 


alors la série de terme général ( (X n a n ) est 
convergente. De plus, pour tout entier 
naturel n, le reste à l’ordre n est majoré en 
norme par p0t /îH _ j . 

On retrouve ainsi la condition suffisante 
de convergence des séries alternées : soit 
(u n ) une suite de nombres réels non nuis 
telle que la suite ((— 1 ) n u n ) soit de signe 
constant. Si la suite (u„) tend vers 0 et si la 
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suite (| u n | ) est décroissante, alors la série 
de terme général ( u n ) est convergente, son 
reste à l’ordre fl est majoré en valeur 
absolue par U n +\ et a le signe de U n +\. 

Il existe donc des séries convergentes 
sans être absolument convergentes, telles 
que la série harmonique alternée, de terme 
général (— 1 ) n /n, pour n ^ 1 ; de telles 
séries sont dites semi-convergentes . 

Familles sommables 

La définition de la somme d’une série 
repose sur le fait que l’ensemble des 
indices est N, et donc un ensemble 
canoniquement ordonné. Dans de nom- 
breux problèmes, l’ordre des termes ne 
joue aucun rôle. Le besoin se fait aussi 
sentir de définir la somme d’une famille 
indexée par un ensemble I (non nécessai- 
rement dénombrable a priori), indépen- 
damment du choix d’une relation d’ordre 
dans 1. 

Soit de nouveau G un groupe commu- 
tatif topologique séparé. On dit qu’une 
famille a = (u,), i G I, d’éléments de G est 
sommable s’il existe un élément 5 de G 
satisfaisant à la condition suivante : Pour 
tout voisinage V de 0 , il existe une partie 
finie J 0 de 1 telle que, pour toute partie 
finie J de I contenant J 0 , on ait : 

s-^«,e v ; 

un tel élément s est unique. On l’appelle 
somme de la famille a et on le note : 



Si 0 admet une base dénombrable de 
voisinages, le support de toute famille 
sommable est dénombrable (ce qui ne 
signifie pas que l’on doive se ramener 
systématiquement au cas ou I = N). 


Soit maintenant E un espace de 
Banach. Le critère de Cauchy devient : 
Pour qu’une famille (u,), i £ I, d’éléments 
de E soit sommable, il faut et il suffit que. 
pour tout voisinage V de 0 , il existe une 
partie finie J 0 de I telle que, pour toute 
partie finie K de I ne rencontrant pas J,,, 
on ait : 



La notion de famille sommable est 
commutative. De manière précise, pour 
toute famille sommable (w ; ), i E 1 , d’élé- 
ments de G et pour toute permutation g 
de I, la famille (w CT (/> i £ I, est sommable, 
et : 



Examinons le cas où 1 = N. Soit (u n ) 
une suite d’éléments de G. On dit que la 
série de terme général (u n ) est commuta- 
tivement convergente si, pour toute permu- 
tation (j de N, la série de terme général 
( u a ( n )) est convergente. Si la suite (u„) est 
sommable, la série de terme général (u„) 
est commutativement convergente. Réci- 
proquement, dans le cas des espaces de 
Banach, la convergence commutative 
implique la sommabilité ; de plus, pour 
toute permutation a de N, 

+ 00 + 00 

X“°w = 2“* = Z“"' 

w = 0 n = 0 «EN 

Soit (u,), i G I, une famille sommable 
d’éléments d’un espace de Banach E et 
(I/j), h G H, une partition de I. Alors, pour 
tout élément h de H, la famille (w,), i £I/ r 
est sommable, la famille (v /? ), h G H, où : 
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l’est encore, et : 



J parcourt l’ensemble des parties finies de 
I, telles que : 



cette formule est dite formule de somma- 
tion par paquets. Soit E„ E 2 , et F trois 
espaces de Banach et S une application 
bilinéaire continue de E, X E 2 dans F ; 
soit (w,), / G I, une famille sommable d’élé- 
ments de E, et (v,), j G J, une famille 
sommable d’éléments de E 9 . Alors, la 
famille (S (u h v,)), (ij) G IX J, est som- 
mable, et on a : 


•(i-i ) i 

y /6i je J J /|i 


S Vj) ; 


la suite ( u t ), t G I, s’appelle terme général 
de la série A. 

On dit qu’une telle série est absolument 
convergente si la famille (u t ), t G I, est 
absolument sommable. La somme : 

x- 

t ei 

s’appelle alors comme la série A. 

Prenons, par exemple, I = ZJ — {0}, 
I + = N r — {0}, a un nombre réel non nul 
et, pour tout élément t = (flj, n 2 , • • • • ft,) de 
1, posons : 


en particulier, on peut définir le produit de 
deux fa mill es sommables d’éléments d’une 
algèbre de Banach. 

La définition des familles absolument 
sommables d’éléments d’un espace vecto- 
riel normé est calquée sur le cas des séries. 
Toute famille absolument sommable est 
sommable. La réciproque est vraie lorsque 
l’espace vectoriel E est de dimension finie 
(mais elle ne l’est pas si l’on suppose 
seulement que E est complet), en particu- 
lier, toute série absolument convergente de 
nombres complexes est commutativement 
convergente. 

Séries multiples 

La théorie des familles sommables s’appli- 
que notamment âüK séries inuillpib" Étant 
donné un espace de Banach E, un entier 
naturel non nul r et une partie infinie I de 
Z r , on appelle série r-uple d’éléments de E 
indexée par 1 tout couple A = ((fy), (Sj)) 
constitué d’une suite r-uple d’éléments de 
E et d’une famille (5j) d’éléments de E, où 


(| ni | + ... + i„ r |)» : 

les séries r-uples de termes généraux (w,), 
/G I, et (m,), î G 1+, convergent si et 
seulement si a > r. Plus généralement, 
pour toute norme sur l’espace vectoriel R r , 
les séries r-uples de termes généraux : 


convergent si et seulement si <j > r. 

Soit maintenant A une série double de 
terme général (i u np ), où (n, p) parcourt N 2 . 
Si cette série est convergente, alors, pour 
tout entier naturel n , la série de terme 
général {u np ),p G N, est convergente, et la 
série de terme général (y /3 ) avec : 


+ “ 



P - o 


est convergente. De plus : 
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dite formule de sommation par lignes des 
séries doubles. On peut énoncer de même 
une formule de sommation par colonnes. 
Les réciproques sont vraies si A est une 
série de nombres réels positifs. 

Produits infinis 

Soit G un groupe commutatif topologique 
séparé. Lorsque la loi de G est notée 
multiplicativement, les séries et les fa mill es 
sommables d’éléments de G prennent 
respectivement les noms de produits infinis 
et de familles multipliables. 

Cependant, lorsque le groupe G est le 
groupe multiplicatif d’un corps commuta- 
tif topologique séparé K, une suite d’élé- 
ments de G ne converge au sens de G que 
si elle converge vers un élément non nul de 
K. Cette remarque conduit à modifier 
légèrement les définitions. 

On appelle produit infini d’éléments de 
K un couple A = ((u,), {p n )) constitué de 
deux suites d’éléments de K telles que, 
pour tout entier naturel n , on ait : 



m = 0 


l’élément s’appelle produit à l’ordre n de 
A, et la suite (u n ) s’appelle terme général 
de A. 

On dit que le produit infini A est 
convergent dans K si u n est non nul à partir 
d’un certain rang et si le produit infini 
de terme général (w„), U ^ « 0 , est conver- 
gent dans G = K*. Il est immédiat que le 
terme général d’un produit infini conver- 
geant dans K converge vers 1. 

On dit de même qu’une famille (u t ) 9 
i G I, d’éléments de K est multipliable dans 
K si le support I 0 de cette famille, c’est-à- 
dire l’ensemble des indices i tels que 
u t 0, est le complémentaire d’une partie 
finie de I et si la famille (w ( ), i Iq, est 
multipliable dans K*. 


Les produits infinis ayant leurs princi- 
pales applications dans la théorie des 
fonctions analytiques, nous nous plaçons 
désormais dans le cas du corps des nom- 
bres complexes. 

Le critère de Cauchy devient ici : Pour 
que le produit infini A converge, il faut et 
il suffit que, pour tout voisinage V de 1, il 
existe un entier naturel Hq tel que, pour tout 
couple ( q , r) d’entiers naturels tel que 
r > q ^ n 0 , on ait : 

m =q -f 1 

L’étude des produits infinis de nombres 
complexes se ramène à celle des séries : 
Soit (u n ) une suite de nombres complexes 
non réels négatifs ; pour que le produit 
infini de terme général (u n ) soit convergent 
(resp. commutativement convergent), il 
faut et il suffit que la série de terme général 
(ln u n ) soit convergente (resp. commutati- 
vement convergente). Soit (y fI ) une suite de 
nombres complexes ; pour que le produit 
infini de terme général (1 -|- v„) soit 
commutativement convergent, il faut et il 
suffit que la série de terme général ( v w ) soit 
absolument convergente. 

Comme le terme général d’un produit 
infini convergent ( u n ) tend vers 1, on pose 
u n = 1 + v,,, où v,, — ► 0. Lorsque ( u n ) est 
une suite de nombres réels positif la 
convergence du produit infini de terme 
général u n équivaut à celle de la série de 
terme général v n , par passage au loga- 
rithme, car ln(l + x) — X au voisinage 
de 0. 

On est alors amené à définir la conver- 
gence absolue d’un produit infini de terme 
général u n par la convergence absolue de 
la série de terme général \ n . Tout produit 
absolument convergent est convergent. 

LUCIEN CHAMBADAL 
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SÉRIES 

TRIG0N0M ÉTRIQUÉS 


L es séries trigonométriques se sont 
introduites au xvm e et au début du 
xix e siècle, en liaison avec certains problè- 
mes de physique (mouvement des cordes 
vibrantes, propagation de la chaleur). Elles 
sont d'un usage courant en astronomie, en 
cristallographie, en optique. Mais c'est en 
mathématiques qu'elles ont joué le rôle le 
plus important. 

La justification du formalisme introduit 
par Joseph Fourier a occupé une grande 
part de l'effort des analystes du xix e et 
même du xx e siècle. Elle a conduit au 
concept moderne de fonction, à la théorie 
de l'intégration, aux notions les plus impor- 
tantes concernant ia sommation des séries 
et enfin à une partie de l'analyse fonction- 
nelle moderne. Il se trouve même qu'un 
problème concernant les séries trigonomé- 
triques est à l'origine de la théorie des 
ensembles. Les séries trigonométriques 
constituent donc l'exemple type d'un objet 


mathématique introduit par les besoins de 
la physique et dont l'étude a conduit à 
l'élaboration de concepts et de théories 
mathématiques de grande portée. 

Ce rôle, sans être aussi important 
qu 'autrefois, n'est pas terminé, et l'article 
s'efforcera d'en donner une idée. 


1 . Notations 

Les séries trigonométriques sont les séries 
de la forme : 

OP 

(1) z (a n cos n iùt + b n sin n ( ùt ), 

fi =o 

oc 

(2) ^ r„ cos {nut + <jp„), 

n = 0 

dans lesquelles t désigne une variable 
réelle, o un nombre > 0 (c'est la fréquence 
fondamentale), les a, et les b n des coeffi- 
cients réels (b 0 =0), les y, des nombres 
^ 0 (les amplitudes) et les cp„ des nombres 
réels définis modulo 2k (les phases). Les 
séries (1) et (2) sont liées par les formules : 

r n COS cp„ = a„ r n sin cp„ = - b . . 

Les sommes partielles s'écrivent : 

S,(t) = ^ (a, cos not + b n si n n w/ ) 

« - o 

N 

= ^ r n cos (n ot + <p„ )■ 

fi = 0 

Il est souvent commode de les écrire : 

N 

( 3 ) S,(t) = ^ c n e‘ nM , 

N 
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en posant c n - ci n -|- ib n , U ^ 0, et c n 
— a,, — ib )V n ^ 0. Cela amène à considé- 
rer, au lieu de séries (1) ou (2), des séries : 

K> 

( 4 ) ^ c„e m(a . , c„e in(àt 

n-— x fiez 

à coefficients c n complexes, dont on définit 
encore les « sommes partielles » par (3). 

C’est sous la forme inspirée de (4) que 
s’écrivent le plus commodément les 
« séries trigonométriques généralisées » : 


(5) 


É 


« = — 00 


où la suite A„ est réelle (les À„ s’appellent 
les fréquences) et les « séries trigonomé- 
triques multiples » : 


( 6 ) 


i 


c g «'»(«. o 


où t = (/|, r 2 , î k ) E R A et où ( n , t ) est le 
produit scalaire n { t ] + n 2 î 2 + + n k t k . 

Dans la théorie des séries trigonomé- 
triques, on choisit généralement G) = 1 
(pour la commodité de l’écriture) ou 
Cl) = 2tt (parce qu’ alors les termes des 
séries (1), (2), (4) sont invariants par le 
changement de t en t -f- 1, et qu’ ainsi t peut 
être considéré comme une variable sur le 
tore T = R/ Z, c’est-à-dire un nombre réel 
défini modulo 1). C’est ce dernier parti que 
nous prendrons. 

Sifest une fonction, à valeurs comple- 
xes, définie sur T, c’est-à-dire une fonction 
périodique et de période 1, on pourra 
tenter de la représenter par une série 
trigonométrique. A cette fin, on lui associe 
la série (4), définie par : 


(7) 


e " = j-/^* £ 


- 2ir/ni 


nG Z; 


on peut interpréter l’intégrale sur T 
comme une intégrale prise sur un intervalle 


quelconque de longueur 1. Si la fonction f 
est réelle, on peut aussi lui associer la série 
(1) définie par : 


(8) 


<*o = JV(o<* 

i , — J f{t ) cos 2 mt dt 

b n = J f(t ) sin 2 mt dt 


où n est un entier ^ 1. 

On appelle formules de Fourier les 
séries (7) et (8) ; leurs premiers membres 
s’appellent « coefficients de Fourier de /», 
et les séries (4), (1) ou (2) correspondantes 
« séries de Fourier de /». 


2. Aperçu historique 

Quoique certaines sommes de séries trigo- 
nométriques aient déjà été calculées par 
L. Euler, on peut considérer que l’histoire 
des séries trigonométriques remonte à la 
solution, donnée par D. Bernoulli, du pro- 
blème des cordes vibrantes . Le problème est 
de calculer (cf. figure) le mouvement d’une 



corde, de longueur /, fixée en ses extrémités, 
et qui est soit écartée de sa position d’équi- 
libre et lâchée (corde de guitare), soit 
frappée de façon à lui imprimer, en ses 
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différents points, des vitesses de déplace- 
ment latéral (corde de piano). 

L’équation des cordes vibrantes, qui 
concerne le déplacement latéral j;(x, t) 
(supposé petit) au temps t du point X de la 
corde, est : 

y» = «K ; 

les conditions initiales imposent : 

y(Q,t) =y(l,t) = 0 

et respectivement : 

Y {x, 0)= cp(x), y' t (x, 0)= 0 

pour la corde pincée, et : 

y t '(x, 0) = ip(x) 

pour la corde frappée. D’Alembert et 
Euler avaient découvert la solution géné- 
rale, sous la forme : 

y(x,t) =f(x + (ùt) — f (x — (ùt ), 

où f est une fonction périodique et de 
période 2 / qui, dans le premier cas, est 
impaire et égale à cp/2 sur [0, [\ et, dans 
le second cas, est paire et primitive de 
ip/2 W sur [0, /]. Pour des raisons physi- 
ques évidentes, D. Bernoulli pensait 
pouvoir écrire la solution sous la forme 
d’une série d’harmoniques solutions de 
l’équation des cordes vibrantes, c’est-à- 
dire : 


/ x V 1 , • n* ntùt 

y(x,t) = y b„sm — cos— — 


dans le premier cas et, dans le second cas, 



P. sin 


n ( ùt 

/ 


Mais cela supposait, par exemple dans 
le premier cas, que l’on puisse écrire cp(x) 
sous !a forme : 


2 



sin 


nx 

T 


Comment une fonction cp (a*) arbitraire 
pourrait-elle se résoudre en une somme de 
fonctions sinus d’arcs multiples? Les 
meilleurs mathématiciens de l’époque 
(1750) ne le croyaient pas possible. 

La question ne fut reprise que cin- 
quante ans plus tard, par Fourier, à 
l’occasion de la théorie analytique de la 
chaleur (1822). L’équation en cause est ici : 

y\ = 

où y est la température au temps t et au 
point x d’une barre maintenue à tempéra- 
ture fixe (par exemple 0) aux extrémités, et 
une solution formelle en est : 

y(x,t) = y' 6„exp( — an 2 ^jsiny , 
de sorte que : 

Z nx 
b n sin — 

De nouveau, on est amené à tenter 
d’écrire une fonction donnée sous forme 
d’une série trigonométrique. Fourier 
donne une série d’exemples, fondés sur des 
formules du type (8). 11 conclut, un peu 
rapidement, que les séries trigonométri- 
ques obtenues sont convergentes, qu’elles 
ont bien pour somme les fonctions don- 
nées et qu’ ainsi sont levées les objections 
faites à D. Bernoulli. 

Il n’en est rien. Mais une bonne part de 
l’analyse mathématique allait sortir de 
cette intuition de Fourier. 

L’étape décisive est l’admirable 
mémoire de 1829 où P. G. Lejeune-Diri- 
chlet donne le premier théorème de conver- 
gence de séries de Fourier. Après avoir 
établi, pour une fonction f monotone et 
continue entre 0 et h, la formule : 

(9) i im [V(O~* = |/(0), 

sinf 2 
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Dirichlet montre que, pour toute fonction 
fmonotone et continue par morceaux sur 
le tore T, les sommes partielles S N (V ) de la 
série de Fourier de / convergent, en tout 
point t , vers : 

'-(f(t + 0)+f(t -0)), 

moyenne des valeurs limites de f à droite 
et à gauche de t . Cela résulte de (9) et de 
l’importante formule : 

(10) S N (f) = J/(r — s)D^s)ds 

= J T /(j)D N (f -s)ds. 


ou : 


N 

D N (s) zz ^ e l * ir * - 
-N 


sin (2 N + 1) t ïs 
sin 7 ïs 


Dans la dernière intégrale (10), D N joue 
le rôle d’un noyau de convolution. On 
l’appelle, naturellement, le noyau de Diri- 
chlet. 

L’intérêt du travail de Dirichlet n’est 
pas seulement dans le résultat, ni dans la 
méthode qui est fort belle. On peut 
considérer que le concept moderne de 
fonction remonte à ce mémoire. Aupara- 
vant, une fonction était donnée soit par 
une expression analytique, soit par une 
représentation graphique. Au contraire, 
pour Dirichlet, la fonction n’est qu’une 
loi qui à chaque valeur x de la variable 
fait correspondre f(x). Pour expliquer, 
par exemple, que les intégrales (8) n’ont 
de sens que pour certaines fonctions, 
Dirichlet considère une fonction cp égale 
à a pour x rationnel et à b pour x 
irrationnel, a étant différent de b. Avec le 
concept d’intégrale qu’on avait à l’époque, 
et qui allait être formalisé par Riemann, il 
s’agit en effet d’une fonction non intégra- 
ble. 


SÉRIES TRIG O NO MÉTRIQUES 


La thèse de Riemann « Sur la possibilité 
de représenter une fonction par une série 
trigonométrique » a pour résultat principal 
un théorème de localisation qui s’exprime 
grossièrement ainsi : Si deux fonctions sont 
égales au voisinage d’un point, leurs séries 
de Fourier ont les mêmes propriétés en ce 
point. Elle introduit une méthode puis- 
sante. Cette méthode consiste à associer à 
une série trigonométrique (4), à coeffi- 
cients tendant vers 0, la série deux fois 
formellement intégrée : 


t (in <i>) 2 


(on suppose pour simplifier Cq = 0), qui 
converge vers une fonction continue F(/ ), 
et elle consiste ensuite à étudier la diffé- 
rence seconde : 

F(r + h)+ F(r — h) — 2 F(r ) 



n* 0 


quand h—* 0. C’est ce qu’on appelle le 
procédé de sommation de Riemann. 

C’est dans la note historique qui pré- 
cède la thèse que B. Riemann, critiquant 
une erreur commise par A. Cauchy, pré- 
cise la théorie des séries numériques en 
distinguant les séries absolument conver- 
gentes (qui sont aussi commutativement 
convergentes) et les séries semi- 
convergentes (auxquelles on peut donner 
n’importe quelle somme par changement 
de l’ordre des termes). Et c’est au tout 
début de l’étude proprement dite que se 
trouve exposée la théorie de Y intégrale de 
Riemann, c’est-à-dire le premier concept 
d’intégrale mathématiquement élaboré. À 
ce stade enfin, pour la première fois, les 
formules de Fourier (7) ou (8) ont un sens 
parfaitement clair ! 
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Il était naturel que le concept de 
fonction et celui d’intégrale apparussent à 
l’occasion de l’étude des séries de Fourier. 
La théorie des ensembles aurait pu naître 
autrement. Il se trouve qu’elle aussi a été 
fondée, par G. Cantor, pour poser et 
résoudre un problème sur les séries trigo- 
nométriques. Il s’agit maintenant de séries 
(1) qui ne sont pas nécessairement séries 
de Fourier. Si deux telles séries convergent 
en tout point vers la même fonction, 
sont-elles nécessairement identiques ? En 
d’autres termes, si la série (1) converge 
vers 0 pour tout t, a-t-on nécessairement 
ü n — b n — 0 pour tout n ? Cantor répond 
affirmativement à la question. Puis, en 
187 1 , sous le titre Extension d'un théorème 
sur les séries trigonométriques, il montre 
que le résultat subsiste si l’on suppose 
seulement que (1) converge vers 0 en 
dehors d’un ensemble fini ou, plus géné- 
ralement, d’un ensemble dont un dérivé 
d’ordre fini ou transfini est vide. C’est loin 
d’être, dans cette direction, le meilleur 
résultat possible. Mais on peut voir là 
l’acte de naissance de la théorie des 
ensembles. 

Deux illustres contre-exemples (1872-1 873). 
K. Weierstrass donne, sous la forme d’une 
série : 

(12) /(0 = I a n cos b n t, 

o 

où b est un entier ^ 2, où 0 < a < 1 et où 
ah ^ 10, le premier exemple d’une fonc- 
tion continue qui n’admet de dérivée en 
aucun point. Paul Du Bois-Reymond cons- 
truit une fonction f continue, monotone 
par morceaux hors de tout intervalle de 
centre 0, mais oscillant indéfiniment au 
voisinage de 0, et dont la série de Fourier 
diverge au point 0. 


L’année 1900 marque un tournant dans 
l’histoire des séries trigonométriques, avec 
les premiers travaux de L. Fejér et surtout 
la thèse de H. Lebesgue. 

Fejér introduit les moyennes arithmé- 
tiques des sommes partielles S N (f ), c’est- 
à-dire les : 

MO = N - (S 0 (O + + S N _,(/ )). 

Ces « sommes de Fejér » s’expriment 
par une formule, analogue à (10), 

(13) MO = J T /(f-i)K N (0<fc 

= J T /(i)K N (/-i)<fc, 

où : 

k n (0 = ;(D,(t) + + D n _,(0) = 

N sin 2 t xt 

Fejér montre que CJ N (0 tend vers : 

+ 0 )+/(»- 0 )) 

chaque fois que cette expression a un sens 
et qu’en particulier a N (f ) tend vers /(/ ) 
quandfest continue en t, uniformément si 
fest continue partout sur T. L’importance 
de ce résultat, en dehors de sa simplicité, 
est d’attirer l’attention sur la notion de 
procédé de sommation . A partir de là, il 
apparaît que, même si une série est diver- 
gente, il est raisonnable de lui attribuer une 
somme au moyen d’un procédé de som- 
mation convenable. 

L’idée n’était pas absolument nouvelle. 
Le procédé de Riemann, déjà décrit, 
consiste à associer à une série numé- 
rique : 
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l’expression, si elle existe : 

tsi-œi 

0 

le procédé d’Abel-Poisson, qui s’introdui- 
sait dans l’étude des séries de Taylor, 
associe l’expression : 



o 


le procédé de Weierstrass, très lié à l’équa- 
tion de la chaleur, 



o 


le procédé d’Émile Borel, introduit pour le 
prolongement analytique des séries de 
Taylor, 



et enfin le procédé de Fejér, ou procédé de 
Cesaro (C, 1), 

N— 1 N 

N li “iZ ( “ 0+ "' + “' )= 

0 0 

À partir de là s’imposait une étude 
systématique des procédés de sommation 
(0. Toeplitz, G. H. Hardy, M. Riesz...). 
L’application aux séries trigonomé- 
triques a donné lieu à une très vaste 
littérature, dont il faut particulièrement 
retenir ce qui concerne les séries trigono- 
métriques multiples (6), dues à Salomon 
Bochner. 

Les propriétés de la fonction K N qui 
figure dans (13), et que l’on appelle le 
noyau de Fejér, expliquent le succès des 
<J N ; ces propriétés sont partagées par 
d’autres fonctions dépendant d’un para- 
mètre, par exemple le noyau de Poisson P, 


et le noyau de Weierstrass W E , qui per- 
mettent respectivement d’écrire : 

OS 

C n r\fi \ e 2mnt = J fÿ — s)P r (s) fifc, 

» 

oc 

Cn e-**e Zlti nt = J f(t—s)W e (s)ds, 

les c n étant les coefficients de Fourier de f. 
Les propriétés en question, communes à 
K n , P, et W e , définissent les « identités 
approximatives » ; la convolution par une 
identité approximative est une bonne 
façon d’approcher une fonction. L’expli- 
citation la meilleure de cette formule un 
peu vague se trouve dans le premier 
chapitre du livre de Y. Katznelson cité en 
référence (cf. représentation et approxi- 
mation des fonctions r chap. 4 et 7). 

La thèse de Lebesgue (1902) donne une 
nouvelle définition de l’intégrale, plus 
générale que celle de Riemann, permettant 
par conséquent de donner un sens aux 
formules de Fourier (7) et (8) et à toutes 
celles qui en dérivent, pour une classe de 
fonctions beaucoup plus étendue. Plus 
tard, A. Denjoy, avec la totalisation, allait 
trouver une nouvelle généralisation de 
l’intégration, permettant d’attribuer un 
sens aux formules de Fourier pour toute 
fonction f susceptible de s’écrire comme 
somme, en tout point, d’une série trigo- 
nométrique partout convergente. A chaque 
sens donné au symbole d'intégration corres- 
pond une définition des séries de Fourier : 
on doit ainsi distinguer les séries de 
Fourier-Riemann, celles de Fourier- 
Lebesgue, celles de Fourier-Denjoy, celles 
de Fourier-Stieltjes (où dt est remplacé par 
une mesure sur T) et celles de Fourier- 
Schwartz (o Ùf(t ) dt est remplacé par une 
distribution sur T). Dès 1906, dans ses 
Leçons sur les séries trigonométriques, 
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Lebesgue montrait le parti qu’on pouvait 
tirer de son intégrale, dans l’étude de la 
convergence ponctuelle et surtout dans 
l’étude de la convergence presque partout, 
qui renouvelait complètement le sujet. De 
1906 date également la thèse de P. FatOU : 
Séries trigonométriques et séries de Taylor , 
où la notion de mesure de Lebesgue est 
largement utilisée. 

L’importance en analyse de l’intégrale 
de Lebesgue s’est ainsi affirmée d’abord à 
l’occasion de la théorie des séries trigono- 
métriques. Un exemple remarquable le 
fera comprendre. On connaissait depuis 
longtemps la « formule de Parseval » : 

f j/mi**- Jjcj 2 , 

nez 

où les c„ sont les coefficients de Fourier de 
f Cette formule vaut non seulement pour 
les fonctions intégrables au sens de Rie- 
mann, mais pour toutes les fonctions f de 
carré intégrable au sens de Lebesgue (ce 
que l’on écrit /G L 2 ). Un théorème, établi 
indépendamment par E. Fischer et par 
F. Riesz (1907), montre que toute suite 
{c n } telle que : 

5>.i* < “ 

nez 

(on écrit {c, f } G l 2 ) est la suite des coeffi- 
cients de Fourier-Lebesgue d’une certaine 
fonction de L 2 ; comme l’écrit quelque part 
F. Riesz, les formules de Fourier (7) sont 
comme un billet aller et retour entre L 2 et 
/ 2 ; moins élégamment, on dit que c’est un 
isomorphisme d’espaces de Hilbert. Or, 
que L 2 soit un espace de Hilbert est un fait 
d’intérêt indépendant et de grande portée. 
Plus généralement, il apparaît que les 
espaces 1 /, de fonctions de pième puis- 
sance intégrable au sens de Lebesgue, sont 
des espaces normés et complets pour 


p ^ 1 ; c’est ce fait fondamental que l’on 
désigne quelquefois aujourd’hui sous le 
nom de théorème de Fischer-Riesz. 

Il est difficile de dresser, même en 
grandes lignes, l’histoire des séries trigo- 
nométriques au cours du XX e siècle. Nous 
retiendrons seulement quelques sujets. 
Mais il est bon d’indiquer que l’épanouis- 
sement des écoles polonaise et russe, dans 
les années 1920-1940, dans le domaine de 
l’analyse fonctionnelle et des probabilités 
est intimement lié à la fois à la théorie de 
l’intégrale de Lebesgue (très mal connue 
en France à l’époque) et aux problèmes 
soulevés par les séries trigonométriques 
(également ignorés en France, à l’excep- 
tion de A. Denjoy, S. Mandelbrojt et 
R. Salem). Le traité de A. Zygmund 
(première édition en 1935, deuxième édi- 
tion rééditée en 1988) est la référence 
essentielle, et il a joué un rôle de premier 
plan dans la formation de plusieurs géné- 
rations d’analystes. 

3. Quelques problèmes 
et autres développements 

La convergence des séries de Fourier 
Dirichlet avait établi que la convergence 
des séries de Fourier avait lieu pour des 
fonctions monotones et continues par 
morceaux, Du Bois-Reymond qu’elle 
n’avait pas nécessairement lieu pour des 
fonctions continues. Le théorème de 
Fischer-Riesz établit, quant à lui, que les 
sommes partielles de la série de Fourier 
d’une fonction /G L 2 tendent vers f dans 
l’espace L 2 . 

Jusqu’en 1966, on n’a pas su si la série 
de Fourier d’une fonction continue sur T 
converge nécessairement sur un ensemble 
non vide. À cette date, L. Carleson a 
montré que, pour toute / G L 2 , la série de 
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Fourier de f converge vers f (t ) presque 
partout. La réponse à la question posée est 
donc positive, C’est le meilleur résultat 
possible, dans ce sens que, étant donné un 
ensemble de mesure nulle sur T, il existe 
une fonction continue dont la série de 
Fourier diverge sur cet ensemble. 

Le théorème de Carleson vaut en rem- 
plaçant L 2 par I/, avec p > 1 (R. Hunt, 
1967). Il ne vaut pas pour L 1 , puisque, dès 
1926, on connaissait des fonctions de L 1 
dont la série de Fourier diverge partout 
(A. N. Kolmogorov). 

Essentiellement, pour les séries de Fou- 
rier à une variable, le problème de la 
convergence se trouve résolu avec les 
travaux de Carleson et Hunt. 

Pour les séries de Fourier à plusieurs 
variables du type (6), avec k ^ 2, il faut 
définir ce qu’on appelle les sommes par- 
tielles avant de poser le problème de la 
convergence. Si l’on prend les sommes 
partielles « cubiques », définies comme la 
somme des termes pour lesquels : 

»up(|#i|,|n 2 |,-.|»*l) < R. 

on a le résultat analogue au théorème de 
Carleson et Hunt (Charles Fefferman, Per 
Sjolin). Si l’on prend les sommes partielles 
« sphériques » définies par : 

n\+ n\ + + n\< K 2 , 

il existe pour tout p < 2 une fonction de 
LT^T^) dont la série de Fourier diverge 
presque partout (Fefferman, 1972) ; la 
situation est donc très différente pour 
k — 1 et pour k ^ 2 ; le problème reste 
ouvert pour p ^ 2, k ^ 2. 

La convergence 
des séries trigonométriques 
La convergence des séries trigonométri- 
ques est une question toute différente de la 
précédente : on considère ici des séries 


dont les coefficients ne sont pas nécessai- 
rement donnés par les formules de Fou- 
rier. Le problème est le suivant : Une 
fonctionfétant donnée, existe-t-il une série 
trigonométrique qui converge presque par- 
tout vers f? On peut supposer / à valeurs 
finies ou infinies, mais on doit la supposer 
mesurable au sens de Lebesgue. 

C’est un sujet étudié, depuis 1916, par 
D. Menchov et l’école russe. Menchov a 
d’abord étudié le cas f= 0. Dans ce cas, 
le problème a évidemment une solution (la 
série à coefficients tous nuis), mais Men- 
chov montre qu’elle n’est pas unique. Dans 
le cas où f a des valeurs finies, le problème 
a une solution positive. Le cas général est 
encore mystérieux. En particulier, on ne 
sait pas s’il existe une série trigonométri- 
que dont les sommes partielles tendent 
vers + co presque partout ; la réponse est 
vraisemblablement négative. 

Si, au lieu de la convergence, on étudie 
la sommabilité d’Abel-Poisson, on obtient 
des résultats plus complets (N. Lusin et 
I. Privalov en 1925, F. Bagemihl et W. Sei- 
del en 1954, J. -P. Kahane et aussi 
Y. Katznelson en 1971) : Étant donné deux 
fonctions f et g mesurables, à valeurs finies 
ou infinies, il existe une série trigonomé- 
trique (1) à coefficients tendant vers 0, qui 
est sommable versfet dont la conjuguée : 

(a, sin niùt — b n cos fl (ùt )> 

n = 1 

avec ici (j) — 2 tt, est sommable vers g. 

Les ensembles d’unicité 
Le problème remonte à Cantor. Quels sont 
les ensembles E sur la droite tels que, si une 
série trigonométrique (1) converge vers 0 
en tout point n’appartenant pas à E, tous ses 
coefficients soient nuis ? On les appellera 
ensembles d’unicité. Tous les autres enseill- 
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blés sont appelés ensembles de multiplicité. 
Complétant les résultats de Cantor, 
W. H. Young montra que tout ensemble 
dénombrable est ensemble d’unicité. Dans 
l’autre sens, il est facile de voir que tout 
ensemble de mesure positive est ensemble 
de multiplicité. Le résultat de Menchov de 
1916, qui a été indiqué plus haut, signifie 
qu’il y a des ensembles de mesure nulle qui 
sont ensembles de multiplicité. 

La réunion de deux ensembles d’unicité 
fermés est un ensemble d’unicité (Nina 
Bari, 1927). Le résultat est faux pour des 
ensembles quelconques, inconnu pour des 
ensembles boréliens. 

La classification des ensembles parfaits 
(fermés sans points isolés) en ensembles 
d’unicité et ensembles de multiplicité fait 
apparaître des phénomènes curieux 
(1.1. Piatetski-Shapiro, R. Salem et A. Zyg- 
mund, A. Rajchman, R. Salem). L’ensem- 
ble triadique de Cantor est un ensemble 
d’unicité. Mais, si l’on considère un ensem- 
ble parfait, décomposable en deux 
portions égales qui lui sont homothétiques 
dans le rapport avec 0 < Ê < 1/2 (le cas 
Ç = 1/3 correspond à l’ensemble triadique 
de Cantor), la réponse dépend de proprié- 
tés arithmétiques du nombre 0 = 1 /£ ; si 0 
est un entier algébrique dont tous les 
conjugués, à l’exception de lui-même, sont 
de module < 1 (on dit alors que 0 est un 
nombre de Pisot), E- est un ensemble 
d’unicité ; sinon, c’est un ensemble de 
multiplicité. Ce résultat est à la source de 
plusieurs travaux sur les nombres de Pisot 
et leurs généralisations (F. Bertrandias, 
Y. Meyer, J. -F. Schreiber). 

Si l’on restreint l’ensemble des séries 
trigonométriques considérées, on agrandit 
la classe des ensembles d’unicité. Ainsi, si 
l’on donne une suite { 0 , les ensembles 
E, tels que la seule série trigonométrique 
( 1 ) vérifiant Cl n [ + h„ < E n et conver- 


geant vers 0 hors de E soit la série à 
coefficients tous nuis, forment une classe 
U(e). Zygmund a montré qu’il existe des 
ensembles U(e) de mesure positive ; un 
problème ouvert est d’en trouver dont le 
complémentaire soit de mesure nulle. 

Les séries trigonométriques 
absolument convergentes 
Considérons les fonctions sommes de séries 
( 4 ) absolument convergentes, avec 
(0 — 2 JT. On vérifie qu’en ajoutant, en 
soustrayant, en multipliant des fonctions de 
cette classe on reste dans la classe ; c’est dire 
que la classe en question est un anneau, 
qu’on désigne par A. Lorsqu’on munit cha- 
que fonction de la norme T\ c n |, c’est un 
anneau normé. La théorie des anneaux nor- 
més est une des perles de l’analyse fonction- 
nelle ; elle est due à L M. Gelfand (1942). 
Mais, avant Gelfand, N. Wiener avait, en 
étudiant l’anneau A, dégagé certaines idées 
maîtresses de la future théorie. Le résultat 
principal (théorème de Wiener-Lévy) est 
que toute fonction analytique d’une fonc- 
tion de la classe A est une fonction de la 
classe A ; en bref, les fonctions analytiques 
opèrent dans A. 

La réciproque fut établie par 
Y. Katznelson en 1958 : Si F est une 

fonction de variable réelle qui opère dans 
A, cette fonction F est analytique. En 
1959, P. Malliavin démontrait que les 
idéaux fermés dans A ne sont pas néces- 
sairement déterminés par leur cospectre ; 
c’est-à-dire qu’une fonction /G A n’est pas 
nécessairement approchable dans A par 

des fonctions qui s’annulent au voisinage 
de l’ensemble de ses zéros. 

Auparavant (en 1954), A. Beurling et 

H. Helson avaient montré que les seules 
applications 4 de T dans T telles que 

/ G A => f 0 cp G A sont les fonctions 
linéaires (ç(t ) = ni + a . 
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Après ces résultats, l’intérêt principal 
s’est porté sur les classes A(E) de fonctions 
définies sur un ensemble fermé E C T et 
prolongeâmes en fonctions de la classe A. 
Ce sont de nouveaux anneaux normés, 
pour lesquels l’extension des théorèmes de 
Katznelson et de Malliavin n’est pas 
facile ; le meilleur résultat dans cette direc- 
tion a été obtenu en 1965 par N. Varo- 
poulos, au moyen de sa théorie des algè- 
bres tensorielles : Les deux théorèmes 
s’étendent dès lors que E contient un 

ensemble de la forme E -j- F, les ensem- 
bles E et F étant deux fermés non dénom- 
brables. 

L’extension du théorème de Beurling et 
Helson est encore plus difficile ; elle a fait 
l’objet de travaux de N. Leblanc. 

Pour certains ensembles E, la classe 
A(E) coïncide avec l’ensemble des fonc- 
tions continues sur E : on les appelle 

ensembles de Helson. Deux problèmes 
posés depuis plus de quinze ans ont été 
résolus tout récemment à leur propos. La 
réunion de deux ensembles de Helson est 
un ensemble de Helson (S. Drury et 
N. Varopoulos, 1971). Il existe un ensem- 
ble de Helson qui porte une distribution, 

non nulle, dont les coefficients de Fourier 
tendent vers 0 à l’infini (T. Kdrner, 1972) ; 
un théorème de Helson affirme qu’une telle 
distribution ne peut être une mesure. Le 

problème principal qui reste est la 
« conjecture de dichotomie » : Ou bien E 
est un ensemble de Helson, et toutes les 
fonctions continues opèrent dans A(E), ou 
bien seules les fonctions analytiques opè- 
rent dans A(E). 

Les séries trigonométriques 
lacunaires 

Les séries trigonométriques lacunaires 
apparaissent pour la première fois dans 
l’exemple de Weierstrass, d’une fonction 
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continue nulle part dérivable. Une fonc- 
tion telle que (12) est très irrégulière ; mais 
elle manifeste une sorte de régularité dans 
l’irrégularité, bien mise en évidence par 
G. Freud (1962) et plus encore par M. Bru- 
neau (1970). 

Considérons une série (5), où {À,,} est 
une suite symétrique, c’est-à-dire telle 
que A n = — A„ satisfaisant à la condition 
de lacunarité : A fl+ j ^ qk n , avec 4 > 1 et 
H = 1, 2, . qu’on appelle condition 
de Hadamard. Dans ce cas, les fonc- 
tions : 

C n + C n 6 — ‘^ nt 

sont presque indépendantes, et on peut 
obtenir pour ces séries l’analogue de beau- 
coup de résultats concernant les sommes 
de variables aléatoires indépendantes ; il 
est d’ailleurs intéressant de noter que, dans 
certains cas, les résultats sur les séries 
trigonométriques lacunaires ont précédé 
ceux qui concernent les variables indépen- 
dantes, pourtant essentiellement plus sim- 
ples. 

Exemples 

1 . Si E c n | 2 < oo, la série (5) converge 
presque partout (Kolmogorov, 1924) ; 
inversement, si la série converge sur un 
ensemble de mesure positive, on a 
E | c n | 2 < oo, et de plus la somme /(/ ) 
vérifie exp (À/ 2 ) (z L 1 pour tout À > 0 
(Zygmund). 

2. Si la série (5) converge en tout 
point d’un intervalle, on a E| < oo 
(S. Sidon). 

Un problème général, posé par S. Man- 
delbrojt, est le suivant. La suite {A„} étant 
donnée, supposons que f ait une série de 
Fourier de la forme (5) et quefsatisfasse 
à une propriété P sur un intervalle, 
arbitrairement petit. S’ensuit-il que f 
ait la même propriété partout ? Lorsque 
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À„+1 — X„ — » 30, avec n — ► ± oc, la réponse 
est positive pour de nombreuses propriétés 
P, par exemple : 

a) la nullité, 

b) l’appartenance à L 2 , 

c) l’appartenance locale à A, 

d) la dérivabiiité d’ordre infini, 

e) l’analyticité. 

De plus, pour les propriétés (a), (h) et 
(c), on connaît explicitement les conditions 
nécessaires et suffisantes sur {A^} pour que 
la réponse soit positive. 

Si l’on prend pour P la propriété d’être 
bornée, ou continue, le problème devient 
plus difficile ; les progrès dans cette direc- 
tion, très liée à la théorie des nombres, sont 
dus à Y. Meyer. 

Les séries trigonométriques 
oléotoines 

Les séries trigonométriques aléatoires sont 
des séries de la forme (1), où les a n et les 
b n représentent des variables aléatoires ; le 
cas le plus simple est : 

a, = a,(o) = ± a„ b n = b n (u) = + 

(variables aléatoires de Rademacher 
indépendantes) ; un autre cas important 
est : 

a «( u ) = X„(.i>)a„, bM= Y„(«)P„, 

où les X„ et Y„ sont des variables aléatoires 
gaussiennes centrées, normalisées et indé- 
pendantes. 

Les séries du premier type apparaissent 
pour la première fois dans des notes de 
R. Paley et A. Zygmund (1932). Un de 
leurs résultats marquants est le suivant. Si 
l’on a : 

* 

Z-i- 

1 


il est presque sûr que la série : 

^ =b a „ cos 2 Tint 

1 

n’est pas une série de Fourier-Lebesgue. 
Ainsi, aucune condition sur les amplitudes 
meilleure que la condition de Fischer- 
Riesz ne garantit qu’une série trigonomé- 
trique est une série de Fourier. 

Les séries du second type ont été 
introduites par N. Wiener dans l’étude 
du mouvement brownien ; on a dans ce 
cas : 



Pour les unes et les autres, la plupart des 
propriétés intéressantes de la série trigo- 
nométrique aléatoire ont pour probabilité 
0 ou 1. La probabilité est la même pour 
que : 

a) la série converge presque partout. 

b) elle soit une série de Fourier-Lebesgue, 

c) elle représente une fonction apparte- 
nant à tous les \J\ avec 1 ^ p < oc 
(PaleyZygmund). 

La probabilité est la même pour que : 
a’) la série converge partout, 
h’) elle représente une fonction bornée, 
c') elle représente une fonction continue 
(P. Billard. 1961). 


4. Applications 

des séries trigonométriques 

En mathématique, les séries trigonométri- 
ques n’ont cessé, depuis deux cents ans, de 
suggérer de nouveaux concepts et de 
nouveaux sujets d’étude. Sans occuper, 
dans la mathématique du XX e siècle, la 
place qu’elles tenaient au XIX e siècle, on 
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peut penser que leur influence n’est pas 
terminée. 

Les méthodes fondées sur les sommes 
trigonométriques jouent un rôle important 
en théorie des nombres : problèmes de 
Goldbach et de Waring, répartition 
modulo 1. Le lien entre séries trigonomé- 
triques et séries de Taylor explique leur 
intérêt dans l’étude du comportement des 
fonctions analytiques à la frontière. Les 
séries trigonométriques généralisées, qui 
interviennent dans la théorie des fonctions 
presque périodiques, ont aussi été appli- 
quées à la fonction Ç(s) de Riemann. On 
pourrait poursuivre la liste des exemples. 

Nées avec le problème des cordes 
vibrantes et la théorie analytique de la 
chaleur, les séries trigonométriques ont 
conservé avec la physique un lien perma- 
nent, en particulier en optique, en astro- 
nomie et en cristallographie. 

La mise en œuvre de programmes de 
transformées de Fourier rapides permet le 
traitement sur ordinateurs de données 
autrefois inexploitables. En un mot, les 
formules de Fourier, dans lesquelles les 
intégrales sont remplacées par des sommes 
finies pour se prêter au calcul, permettent 
le calcul de N coefficients au moyen d’un 
nombre d’opérations (additions, multipli- 
cations) qui est de l’ordre de N 2 . La 
« transformée de Fourier rapide » permet 
d’obtenir ces N coefficients au moyen de 
N ln N opérations. Le gain est considéra- 
ble. 

C’est ainsi qu’en 1970, dans certains 
programmes du Centre interrégional de 
calcul électronique (C.I.R.C.É.) à Orsay, 
on pouvait calculer plus d’un million de 
coefficients en moins de dix minutes. Ces 
programmes ont été utilisés particulière- 
ment en astrophysique. 

JEAN-PIERRE KAHANE 
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SPECTRALE ihéorie 


L ? objet de la théorie spectrale est 
d’obtenir, pour certains endomor- 
phismes d’un espace hilbertien, des formes 
réduites analogues aux formes canoniques 
de Jordan pour les endomorphismes d’un 
espace vectoriel de dimension finie et aux 
formes diagonales pour les endomorphis- 
mes hermitiens d’un espace vectoriel her- 
mitien de dimension finie. La théorie des 
applications de Hilbert-Schmidt, rencon- 
trées pour la première fois à propos des 
équations intégrales, permet de construire 
une première généralisation des résultats 
obtenus en dimension finie. En fait, le 
cadre naturel de cette généralisation est 
celui des applications compactes, étudiées 
par F. Riesz. 

Néanmoins, le cas des endomorphis- 
mes les plus généraux échappe à ce cadre ; 
il fait l’objet de la théorie spectrale de 
Hilbert, qui utilise les techniques de l’inté- 
gration. On a axiomatisé la théorie spec- 
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traie, grâce aux concepts généraux de 
C* -algèbre et d’algèbre hilbertienne. 


1. Théorie spectrale algébrique 

Tant en algèbre qu’en analyse, on est 
fréquemment amené à définir et à calculer 
des fonctions d’un endomorphisme u d’un 
espace vectoriel E sur un corps commu- 
tatif K (inverse, puissances, exponentielle, 
etc.). À cet effet, il est utile de chercher les 
droites de E stables par u. On est ainsi 
conduit aux notions de valeur propre et de 
vecteur propre. On dit qu’un élément non 
nul x de E est un vecteur propre de u si la 
droite engendrée par x est stable par u, 
c’est-a-dire s’il existe un élément À de K tel 
que u(x) = \x. On dit qu’un scalaire X est 
UIIC valeur propre de u si le noyau de 
u ÀI E est non réduit à {0} L’ensemble 
des valeurs propres de u s’appelle spectre 
ponctuel de u et se note sp (w). 

Même lorsque E est de dimension finie 
et que K est algébriquement clos, il peut 
arriver que E ne soit pas somme directe de 
droites stables par u. C’est le cas par 
exemple lorsque u est un endomorphisme 
nilpotent non nul de E. On voit apparaître 
l’intérêt de la notion d’endomorphisme 
diagonalisahle : on appelle ainsi un endo- 
morphisme u de E tel que E soit somme 
directe de droites stables par w, ou encore 
tel qu’il existe une base de E constituée de 
vecteurs propres de u. Lorsque E est de 
dimension finie, cela revient à dire qu’il 
existe une base de E telle que la matrice 
associée à u dans cette base soit diagonale. 
Il peut arriver que plusieurs droites 
stables correspondent à une même valeur 
propre. 


C’est pour cela que, pour toute valeur 
propre A de w, on introduit le sous-espace 
propre associé à A, à savoir le noyau de 
U — Àlg. La somme des sous-espaces pro- 
pres de u est toujours directe ; pour que u 
soit diagonalisable, il faut et il suffit que 
cette somme soit égale à E. 

Dans le cas où u n’est pas diagonalisa- 
ble, il convient d’introduire des SOUS- 
espaces vectoriels de E stables par u « plus 
gros » que les sous-espaces propres : on 
appelle sous-espace spectral de u associé à 
une valeur propre A de u le sous-espace 
vectoriel réunion des sous-espaces vec- 
toriels : 

E^ r = Ker [(« — XI E ) r ] > 

où r G N. Si la suite (E^ r ) est stationnaire, 
on dit que A est l’indice fini. Le plus petit 
des entiers r tels que r = s’appelle 
alors indice de A et se note n(A). Lorsque 
F x est de dimension finie, on dit que À est 
de multiplicité finie ; la dimension de F^ 
s’appelle alors multiplicité de la valeur 
propre A. La somme des sous-espaces 
spectraux de u est toujours directe ; on dit 
que u est trigonalisable si cette somme est 
égale à E. 

Lorsque E est de dimension finie, le 
spectre de u est fini ; il est constitué des 
scalaires A tels que : 

det(ÀI E — u ) = 0, 

c’est-à-dire des racines du polynôme 
det (XI, — w), appelé polynôme caractéris- 
tique de U , De plus, toute valeur propre \ 
de u est de multiplicité finie et égale à la 
multiplicité deia racine A du polynôme 
caractéristique de u . En outre, l’idéal de 
K[X] constitué des polynômes P tels que 
P(u) = 0 est non réduit à {0} ; il admet 
donc un générateur, appelé polynôme 
minimal de u. Toute valeur propre A de u 
est d’indice fini et égal à la multiplicité de 
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la racine A du polynôme minimal de u. 
Enfin, le polynôme minimal de u divise 
le polynôme caractéristique de u ; ce 
résultat s’appelle théorème de Hamilton- 
Cayley. 

Grâce à ces notions, on peut caracté- 
riser les endomorphismes diagonalisables 
et les endomorphismes trigonalisables. 
Pour que u soit trigonalisable, il faut et il 
suffit que le polynôme minimal (ou le 
polynôme caractéristique) de u soit scindé, 
c’est-à-dire décomposable en produit de 
facteurs du premier degré. Pour que u soit 
diagonalisable, il faut et il suffit que le 
polynôme minimal de u soit scindé et que 
toutes ses racines soient simples. D’autre 
part, pour que u soit trigonalisable, il faut 
et il suffit qu’il existe une base de E telle que 
la matrice associée à u dans cette base soit 
trigonale supérieure. 

En combinant les caractérisations don- 
nées ci-dessus, on obtient un résultat plus 
précis : soit u un endomorphisme trigona- 
lisable ; pour toute valeur propre À de w, il 
existe une base B A du sous-espace spectral 
F Â telle que la matrice associée dans cette 
base à l’endomorphisme « A de F A coïnci- 
dant avec U soit de la forme : 



' 1 •• ! 

La matrice R associée à u dans la base B 
obtenue en réunissant les bases B A est une 
matrice diagonale de matrices trigonales : 

■■( • i 

>K U° Af$ . ’ M k I 


Une telle matrice trigonale supérieure 
est dite réduite. 

On peut enfin mettre la matrice associée 
à un endomorphisme trigonalisable sous 
une forme canonique, grâce à la notion de 
matrice de Jordan ; on appelle ainsi une 
matrice carrée de la forme : 

y A 1 0 ... OV 

I 0 A 1 ... 0 \ 

I 0 0 A ... 0 1 


1 0 0 0 A 1 / 

\o 0 0 A f 

c’est-à-dire une matrice dont les éléments 
diagonaux sont égaux, dont les éléments 
juste au-dessus de la diagonale sont égaux 
à 1 et dont les autres éléments sont 
nuis. 

Pour toute valeur propre A de l’eildo- 
morphisme trigonalisable w, il existe une 
base B À de F À telle que la matrice M A 
associée à u„ dans cette base soit une 
matrice diagonale de matrices de Jordan. 
La matrice /associée à u dans la base B est 
encore une matrice diagonale de matrices 
de Jordan ; en particulier, ses éléments 
juste au-dessus de la diagonale sont égaux 
à 0 ou à 1. Une telle matrice est dit ç forme 
réduite de Jordan. Le calcul des puissances 
successives de /s’effectue aisément à partir 
de la formule du binôme de Newton. 

Soit par exemple u l’endomorphisme de 
R 5 canoniquement associé à la matrice : 



Le polynôme caractéristique de u est 
(X + 1) 2 (X — l) 3 . L’endomorphisme u est 
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trigonalisable, mais il n’est pas diagonali- 
sable. Soit B la base de R 5 définie à partir 
de la base canonique par la matrice de 
passage : 



La matrice J = P 1 MP associée à u 
dans la base B est sous la forme réduite de 
Jordan : 

1 0 0 o\ 

10 0 0 I 

0 1 1 0 I 

0 0 1 1 I 

0 0 0 1 / 


2. Théorie de Riesz 

des applications linéaires 

compactes 

Applications linéaires compactes 

Historiquement, la notion d’application 
linéaire compacte s’est introduite sous le 
nom d’application complètement conti- 
nue : étant donné deux espaces vectoriels 
normés E et F, une application linéaire u 
de E dans F est dite complètement continue 
si de toute suite bornée (x n ) d’éléments de 
E on peut extraire une suite (y„) telle que 
la suite (u(y p )) soit convergente dans F. 

F. Riesz fut le premier à remarquer que 
cette condition permet de retrouver tous 
ies résuitats de ia théorie de Fredholm (cf. 
équations intégrales, chap. 5). En utili- 
sant la caractérisation des espaces métri- 
ques compacts à l’aide de la condition de 
Bolzano-Weierstrass, on voit immédiale- 
ment qu’une application linéaire u de E 
dans F est complètement continue si et 


seulement si l’image par U de la boule unité 
de E est une partie relativement compacte 
de F. Sous cette forme, la notion d’appli- 
cation complètement continue peut se 
généraliser aux espaces vectoriels topolo- 
giques. 

Plus précisément, soit E et F deux 
espaces vectoriels topologiques localement 
convexes séparés. On dit qu’une applica- 
tion linéaire u de E dans F est compacte 
(resp. précompacte) s’il existe un voisinage 
V de 0 dans E tel que w(V) soit une partie 
relativement compacte (resp. précom- 
pacte) de F. 

Toute application compacte est pré- 
compacte ; la réciproque est vraie si 
l’espace vectoriel F est complet ou, plus 
généralement, si toute partie fermée bor- 
née de F est complète. Toute application 
précompacte est continue ; la réciproque 
est fausse. Ainsi, pour que l’application 
identique 1, de E soit précompacte, il faut 
et il suffit que E soit de dimension finie, 
auquel cas elle est compacte (lemme de 
F. Riesz). 

Les applications compactes de E dans 
F constituent un sous-espace vectoriel de 
l’espace vectoriel des applications linéaires 
continues de E dans F. 

Soit u une application linéaire continue 
de E dans F et v une application linéaire 
continue de F dans un troisième espace G. 
Si l’une des applications u et v est com- 
pacte, il en est de même de l’application 
composée v o U. En particulier, les endo- 
morphismes compacts de E constituent un 
idéal bikïtcre de V^ibrz £/ v E) des endo- 
morphismes continus de E. 

Soit E’ et F’ les duaux topologiques de 
E et de F, munis de la topologie de la 
convergence uniforme sur les disques com- 
pacts. Alors, si u est compact, il en est de 
même de 1 u . 
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Enfin, toute application linéaire de rang 
fini est compacte. 

On peut énoncer des propriétés analo- 
gues pour les applications précompactes. 

Revenons au cas particulier où les 
espaces E et F sont normés ; munissons 
l’espace vectoriel C(E, F) de la norme des 
applications linéaires continues, à savoir la 
norme de la convergence uniforme sur la 
boule unité de E. Alors les applications 
précompactes de E dans F constituent un 
sous -espace vectoriel fermé de C(E, F). Il 
en est de même des applications compactes 
de E dans F, lorsque F est complet. Il en 
résulte que la limite en norme d’une suite 
d’applications de rang fini est une appli- 
cation compacte. Réciproquement, lors- 
que l’espace vectoriel F est hilbertien, 
toute application compacte de E dans F est 
limite d’une suite d’applications de rang 
fini. Forsque F est un espace de Banach, 
cette réciproque se ramène au problème 
suivant : l’application identique d’un 
espace de Banach est-elle limite forte de 
projecteurs de rang fini (propriété 
d’approximation) ? Ces deux problèmes 
ont été résolus par la négative en 1976. 

Supposons maintenant que E et F sont 
des espaces de Banach ; soit E’ et F’ les 
duaux topologiques de E et de F, munis des 
normes correspondantes. Pour qu’une 
application linéaire continue u de E dans 
F soit compacte, il faut et il suffit que sa 
transposée { u soit une application com- 
pacte de F’ dans E’. 

En particulier, si E et F sont des espaces 
hilbertiens, l’adjointe u* d’une application 
compacte u de E dans F est une application 
compacte de F dans E. 

Fes propriétés des applications de 
rang fini se généralisent aux applica- 
tions linéaires compactes, ce qui fait le 
principal intérêt de ces dernières. Faurent 


Schwartz a dégagé le résultat fondamental 
suivant : 

Théorème de finitude. Soit E et F deux 
espaces vectoriels localement convexes 
séparés, u et v deux applications linéaires 
continues de E dans F. On suppose que u 
est un isomorphisme de E sur F et 
que v est compacte. Alors le noyau de 
W = U + V est de dimension finie, l’image 
de vv est un sous-espace vectoriel fermé de 
codimension finie dans F, et on a la for- 
mule : 

dim Ker(w) = codim F Im(yv), 

dite formule du rang. De plus, w est 
un morphisme strict, c’est-à-dire que Vf 
définit un isomorphisme de E/Ker(vf) sur 
Im( Vf). 

Ce théorème a trouvé des applications 
non seulement dans la théorie spectrale, 
que nous esquissons ci-dessous, mais aussi 
dans la théorie des faisceaux analytiques 
cohérents (cf. gÉomÉtrie algébrique, 
chap. 6) et dans celle des indices topolo- 
giques. 

Spectre d’un endomorphisme compact 

Examinons maintenant le cas particulier 
où E = F et supposons que le corps de 
base est le corps C des nombres comple- 
xes. On appelle spectre d’un endomor- 
phisme continu U de E l’ensemble, noté 
Sp (w), des nombres complexes A tels que 
U — AI, ne soit pas inversible dans l’algèbre 
unitaire C(E). Fes éléments de Sp (u) 
s’appellent valeurs spectrales de u. Fors- 
que E est un espace de Banach, le spectre 
de U est une partie compacte non vide de 
C. Toute valeur propre de u est une valeur 
spectrale de w, mais la réciproque est 
fausse si E n’est pas de dimension finie ; il 
peut même arriver que u n’ait aucune 
valeur propre. C’est la principale raison 
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pour laquelle la réduction des endomor- 
phismes continus de E nécessite des outils 
radicalement nouveaux (cf. infra , chap. 3). 
Cependant, lorsque l’endomorphisme u 
est compact, les principaux résultats de la 
réduction des endomorphismes d’un 
espace vectoriel de dimension finie se 
généralisent. 

Plus précisément, soit u un endomor- 
phisme compact d’un espace vectoriel 
localement convexe séparé E et X une 
valeur spectrale non nulle de u. 

a) Le nombre complexe X est une 
valeur propre de u. 

b) Le sous-espace propre : 

E x = Ker(*/ — XI E ) 

est de dimension finie. Plus généralement, 
pour tout entier naturel non nul Y, le 
sous-espace : 

E x§ , = Ker (u — AI,)’ 

est de dimension finie. En outre, X est une 
valeur propre d’indice fini. En particulier, 
le sous-espace spectral F À est de dimension 
finie. 

c) Le sous-espace vectoriel : 

E’, = Im(« — XI E ) 

est fermé de codimension finie dans E. 
Plus généralement, pour tout entier naturel 
non nul r, 

E' x> , = Im (u — XI E ) r 

est fermé de codimension finie. 11 en est de 
même de : 

r — 0 

d) Les sous-espaces vectoriels et F’, 
sont supplémentaires topologiques dans E 
(c’est-à-dire qu’ils sont supplémentaires et 


que les projecteurs associés sont continus). 
De plus, l’endomorphisme de F À coïnci- 
dant avec u est nilpotent, tandis que 
l’endomorphisme de F’, coïncidant avec u 
est un automorphisme de l’espace vectoriel 
localement convexe séparé F\. 

En outre, le spectre d’un endomor- 
phisme compact u d’un espace vectoriel 
localement convexe séparé E est une partie 
compacte non vide de C, et tout point de 
sp (u) autre que 0 est isole. Autrement dit, 
ou bien le spectre de u est fini, ou bien il 
est constitué de 0 et d’une suite (A,) de 
nombres complexes non nuis convergeant 
vers 0. Lorsque l’espace vectoriel E n’est 
pas de dimension finie, 0 appartient tou- 
jours au spectre de u. On notera néan- 
moins que les résultats précédents ne 
s’appliquent pas à la valeur spectrale 0. Or, 
il peut arriver que u soit compact et injectif 
et que le spectre de U soit réduit à {0}, ce 
qui signifie que u est quasi nilpotent, 
c’est-a-dire que : 

lim || u n || l/n = 0 ; 

« — + 00 

c’est le cas pour l’endomorphisme de 
C([0, 1]) qui à toute fonction continue sur 
[a, b] associe sa primitive s’annulant au 
point a. 

Enfin, l’endomorphisme transposé ( u 
d’un endomorphisme compact u a le 
même spectre que u et les mêmes valeurs 
propres non nulles. avec les mêmes indices 
et les mêmes multiplicités pour u et ! u. Plus 
précisément, pour tout entier naturel non 
nul r, le sous-espace : 

Im[('H KL v y] 

est l’orthogonal de Ker[(u — ÀI E ) r ] et de 
même le sous-espace : 

Im[(« -AIe )'] 

est l’orthogonal de Ker[('w ÀI E ) r ] 
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Alternative de Fnedholm 

Soit E un espace vectoriel de dimension 
finie, E* son dual, W un endomorphisme de 
E et hv le transposé de w. Alors Falterna- 
tive suivante est vraie (cf. algèbre LINÉAIRE 

ET MULTILINÉAIRE) : 

a) Ou bien H’ et l w sont des automor- 
phismes. Dans ce cas, pour tout élément y 
de E et pour tout élément y* de E*, les deux 
équations suivantes : 

(1) H >(x)=y, 

(2) ^y* 

admettent une solution et une seule. 

b) Ou bien les noyaux de w et de r H’ ne 
sont pas réduits à {0} et, dans ce cas, 

dim Ker(w) = dim Ker(')v). 

L’équation (1) admet une solution si et 
seulement si y est orthogonal à Ker(by), et 
l’équation (2) admet une solution si et 
seulement si y* est orthogonal à Ker(w). 

Cette alternative ne subsiste pas lorsque 
W est un endomorphisme continu d’un 
espace vectoriel localement convexe 
séparé E, même si E est un espace hilber- 
tien et si W est hermitien. Néanmoins, à 
l’aide du théorème de finitude et de la 
théorie de Riesz, on démontre l’énoncé 
suivant : 

Soit E un espace vectoriel localement 
convexe séparé, E’ son dual topologique, u 
un automorphisme de E, v un endomor- 
phisme compact de E et w — U + V. Alors 
l’alternative énoncée plus haut reste vala- 
ble, mutatis mu tandis. En particulier, les 
assertions suivantes sont équivalentes : 

a) l’endomorphisme W est un auto- 
morphisme de E ; 

b) l’endomorphisme w est injectif ; 

c') l’endomorphisme w est surjectif ; 

d) l’endomorphisme l w est un auto- 
morphisme de E’ ; 


e) l’endomorphisme ! \v est surjectif ; 

f) l’endomorphisme f w est injectif. 

Grâce aux résultats précédents, on 

peut préciser la nature de la résolvante 
d’un endomorphisme compact. Soit u un 
endomorphisme d’un espace vectoriel 
localement convexe séparé E. On dit qu’un 
nombre complexe A est une valeur singu- 
lière de w si A n’est pas seul et si 1/À 
appartient à sp(w). Le complémentaire 
de l’ensemble des valeurs singulières 
est noté reg(w). Lorsque u est compact, 
reg(w) est un ouvert de C dont le com- 
plémentaire est discret. Considérons alors 
la résolvante R de U, c’est-à-dire l'appli- 
cation : 

g^(I E — mm )- 1 

Cette résolvante est holomorphe sur 
reg (w), et chaque valeur singulière A de u 
est un pôle d’ordre égal à la multiplicité 
m(A) de la valeur propre 1/À. Plus préci- 
sément, soit p k et q- K les projecteurs sur F v 
et F’,, où V = 1/À. Alors u se décompose 
de la manière suivante : 

u= r x + s kt 

où t\ = q } u et s k = p k u. De plus : 

a) L’endomorphisme r k est compact et 
À est une valeur régulière de r k . 

b) L’endomorphisme s k est continu de 
rang fini et A est l’unique valeur singulière 
de s k . 

c) La résolvante de u est égale au 
produit des résolvantes de r k et de S k . Celle 
de r k est holomorphe au voisinage de A ; 
celle de s k admet A pour unique pôle, 
d’ordre m(A). 

Cas des espaces hilbertiens 

Soit E un espace hilbertien et u un endo- 
morphisme continu de E. Supposons que 
U est normal, c’est-à-dire que u*u = un* 
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(l’importance de cette classe d’endomor- 
phismes provient du fait que les endomor- 
phismes hermitiens, antihermitiens ou uni- 
taires sont normaux). Alors la norme de u 
est égale au rayon spectral de w, c’est-a-dire 
au rayon du plus petit disque de centre 0 
contenant le spectre de u. En particulier, 
un endomorphisme normal dont le spectre 
est réduit à {0} est nul. En outre, toute 
valeur propre A de u est d’indice 1, et l’on 
a : 


Mu •) = E x (k). 


Enfin, les sous-espaces propres de u 
sont orthogonaux deux à deux. Néan- 
moins, il peut arriver qu’un endomor- 
phisme continu normal (ou même hermi- 
tien) n’admette aucune valeur propre. Il en 
est ainsi de l’endomorphisme de multipli- 
cation par une fonction continue non 
constante à valeurs réelles dans l’espace 
hilbertien L 2 ([æ, b]) des classes de fonctions 
de carré intégrable sur [a, b]. Toutefois, 
lorsque u est à la fois compact et normal, 
la théorie-de Riesz prend la forme achevée 
que voici : 

Théorème spectral. Soit u un endomor- 
phisme compact et normal d’un espace 
hilbertien E. 

a) Le spectre de u est une partie 
compacte de C dont tout point autre que 
0 est isolé. 

b) Toute valeur spectrale non nulle de 
U est valeur propre de u. 

c) Pour tout élément non nul A de 
sp(«), le sous-espace propre E À est de 
dimension finie. 

(I) L’espace hilbertien E est somme 
hilbertienne des sous-espaces propres de w, 
c’est-à-dire que ces sous-espaces propres 
sont orthogonaux deux à deux et que leur 
somme directe est dense dans E. En 
particulier, tout vecteur x de E s’écrit 


d’une manière et d’une seule sous la 
forme : 



>.es P («) 


où, pour tout élément A de sp (u), 
appartient à E^. Dans ces conditions, on a 
les formules : 

u(x > = ^ u*(x) - 

A.e$p(H) ÀGsp(ü) 

dites formules de décomposition spectrale. Il 
existe donc une base hilbertienne de E 
constituée de vecteurs propres de u. 

On notera que le théorème précédent 
s’applique au cas d’un endomorphisme 
normal u d’un espace vectoriel hermi- 
tien de dimension finie. Dans ce cas, le 
spectre de u est fini, et les familles 
sommables intervenant dans les for- 
mules de décomposition spectrale se rédui- 
sent à des sommes finies. Il existe alors 
une base orthonormale de E constituée 
de vecteurs propres de u. En particulier, 
tout endomorphisme normal de E est 
diagonalisable. Par suite, pour toute 
matrice normale M, il existe une matrice 
diagonale D et une matrice unitaire P telles 
que : 


M = PDP~ l 


Ce résultat s’applique a la réduction des 
formes hermitiennes par rapport à une 
forme hermitienne positive non dégénérée 
(Cf. formes quadratiques). 

La théorie précédente s’applique aussi 
au cas des endomorphismes de puissance 
p-ième nucléaire : étant donné un espace 
hilbertien E et un endomorphisme hermi- 
tien positif h, le nombre : 

^ (A(<?/) \ei) 

i € I 
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est indépendant du choix d’une base hil- 
bertienne (e,), i £= 1, de E. Ce nombre 
s’appelle trace de h et se note tr(/? ). Soit 
maintenant p un nombre réel supérieur à 
1, E et F deux espaces hilbertiens et U un 
élément de C(E, F). On appelle valeur 
absolue de u l’endomorphisme 
U [ = (u*u) l l 2 ; on dit que u est de puis- 
sance p-ième nucléaire si la trace de u \ p 
est finie. On pose alors : 

Lorsque p = 1, de telles applications 
sont dites nucléaires , ou encore îraçables . 
Lorsque p = 2, on les appelle upplicutions 
de Hilbert-Schmidt , ou applications de carré 
traçable (cf. équations différentielles, 
chap. 3, et équations intégrales, chap. 5). 
Les applications de puissance p-ième 
nucléaire sont compactes ; plus précisé- 
ment, soit u une application compacte de E 
dans F, soit (e,), i 6 I, une base hilbertienne 
de E constituée de vecteurs propres de [ U , 
et (p.), i (E I, la famille correspondante de 
valeurs propres. Pour que u soit de puis- 
sancep-ième nucléaire, il faut et il suffit que : 

^ Mf < + °°- 

/El 

Dans ces conditions, on a : 



Les applications de puissance p-ième 
nucléaire constituent un sous-espace vec- 
toriel, noté C /; (E, F), de l’espace vectoriel 
des applications compactes, et l’applica- 
tion u N„(u) est une norme sur C /; (E, F), 
qui en fait un espace de Banach. Les 
applications de rang fini sont denses dans 
C /J (E, F), et la convergence au sens de la 


norme N implique la convergence dans 
C(E, F). On peut alors développer une 
théorie des espaces £^(E, F) en tous points 
analogues à celle des espaces L/ interve- 
nant dans la théorie de l’intégration (cf. 

INTÉGRATION ET MESURE, Chap. 4). 

Soit maintenant u un élément de £ ! (E) 
et (À, ? ) la suite des valeurs propres non 
milles de u , chacune d’elles étant écrite un 
nombre de fois égal à sa multiplicité. La 
série de terme général (A„) est absolument 
convergente, et donc convergente ; sa 
somme s’appelle trace de u . De même, 
pour tout nombre complexe 3, le produit 
infini de terme général (1 + zk n ) est 
convergent ; on pose : 

det(I E +zu) = i i (1 +z\ H ) 

n = 0 

La fonction entière Z det(Ij; + zu) 
s’appelle déterminunt de Fredholm de 
l’endomorphisme u ; on peut calculer son 
développement en série entière en intro- 
duisant les puissances extérieures hilber- 
tiennes de w, notées A '(u) : 

det(I E + zu) = z tr(A'(w)> r - 

r = 0 

On généralise ainsi la théorie du poly- 
nôme caractéristique, ce qui constitue la 
théorie de Fredholm . 


3. Théorie spectrale de Hilbert 

Soit u un endomorphisme continu normal 
d’un espace hilbertien E. La sous-algèbre 
unitaire fermée autoadjointe A de C(E) 
engendrée par u est une C* -algèbre com- 
mutative unitaire, dont le spectre s’identi- 
fie canoniquement à celui de u. De plus, la 
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transformation de Gelfand est un isomor- 
phisme de A sur l’algèbre C(sp(A)) des 
fonctions continues sur le spectre de A. 
L’isomorphisme réciproque définit un 
morphisme (p de C(sp(A)) dans l’algèbre 
unitaire C(E) ; c’est l’unique morphisme de 
C(sp(A)) dans C(E) tel que cp(z) =u , où z 
est l’injection canonique de sp (A) dans C. 
Pour tout élément f de C(sp (A)), T endo- 
morphisme cp(/ ) se note encore f (u). Cette 
théorie permet donc de définir un calcul 
fonctionnel portant sur les fonctions conti- 
nues de u. En particulier, u * = cp(z). 
L’objet de la théorie spectrale de Hilbert 
est d’étendre le calcul fonctionnel à des 
fonctions plus générales. On observe à cet 
effet que, pour tout couple (x, y) d’élé- 
ments de E, l’application : 

/— = </(«)(*) W 

eSt (Cf. INTÉGRATION ET MESURE, Chap. 4 ) 

une mesure de Radon sur sp(u). De plus, 
l’application : 

est sesquilinéaire hermitienne. Enfin, on 
a : 

iiujki* il. y. 

Les mesures p v s’appellent mesures 
spectrales associées, à u. On dit qu’une 
fonction / définie sur Sp(w) à valeurs 
complexes est u-mesurable si, pour tout 
couple (x, y) d’éléments de E, cette fonc- 
tion est p v v -mesurable. On note L”(u) 
l’algèbre des classes de fonctions 
wnircyùT cibles essentiellement et, 

pour tout nombre réel p ^ 1 , on note 
L P(ü) l’espace vectoriel des classes de 
fonctions u-mesurables appartenant à 
L/(ju vr ) pour tout couple (x, y) d’éléments 
de E. On démontre alors le théorème 
fondamental suivant : Pour tout élément / 


de L’(u), il existe un élément et un seul de 
C(E), noté / (w), tel que, pour tout couple 
(x, y) d’éléments de E, on ait : 

f f(z)» x , y (z) =(f («)(*) |y). 

Jsp(H) 

C’est pourquoi f (u) se note encore : 



où p désigne la mesure vectorielle corres- 
pondant aux mesures scalaires En 

particulier, on a les formules de décom- 
position spectrale suivantes : 

f w*=r zp(z). 

v $p(h) Jsp(«) 

De plus, l’application / >— ► / (u) est 
linéaire, et | f (m)]* = / ( u *). En outre, pour 
toute suite (f n ) d’éléments de L \u) conver- 
geant simplement vers/, dominée par une 
fonction positive g appartenant à L’(u), la 
fonction / appartient à L’(u) et les endo- 
morphismes f(u) convergent fortement 
vers f (u) ; c’est le théorème de convergence 
dominée de Lebesgue. Enfin, pour tout 
élément / de L [ (u) et pour tout élément g 
de L 3C (w), on a l’égalité : 

oww =nmu\ 

En particulier, l’application u l_ ^ / (u) 
définit un morphisme de la C* -algèbre 
L”(u) dans C(E), prolongeant ainsi le calcul 
fonctionnel aux éléments de L”(u) ; les 
éléments f(u), où / appartient à L ] (w), 
appartiennent au bicommutant de A. Lors- 
que / est la fonction caractéristique d’une 
partie M de (xu) C5t un projecteur 

hermitien de E, noté P M , appartenant au 
bicommutant de A. Les projecteurs P M 
s’appellent projecteurs spectraux de w, et 
leurs images s’appellent variétés spectrales 
de u. Lorsque E est de dimension finie et 
que M est réduite à un point, on retrouve 
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la notion de sous-espace propre. Le calcul 
fonctionnel précédent permet de générali- 
ser aux endomorphismes normaux la plu- 
part des résultats de la théorie spectrale 
classique. On peut même définir un calcul 
fonctionnel portant sur les opérateurs nor- 
maux non bornés ; ses applications sont 
nombreuses (mécanique quantique, pro- 
blèmes de Sturm-Liou ville). 

LUCIEN CHAMBADAL et JEAN-LOUIS OVAERT 
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SYMBOLIQUE CALCUL 


L e calcul symbolique est né au XIX e siè- 
cle d’une succession de démarches 
heuristiques et il a été particulièrement 
développé par Heaviside pour l’étude des 
circuits électriques. 

Si l’on désigne par p la dérivation, p 1 
désignera naturellement la double dériva- 
tion, \jp l’intégration (encore faut-il choi- 
sir convenablement la « constante d’inté- 
gration »). L’opérateur qui à la fonction 
f (t) fait correspondre la fonction j (t — a) 


pourra, compte tenu de la formule de 
Taylor (cf. calCUL infinitésimal - Calcul 
à une variable, chap. 3), être représenté par 
C~ a l\ En fait tous les opérateurs représentés 
ainsi symboliquement ont la propriété de 
permuter avec les translations dans le 
temps. Physiquement, cela signifie que ces 
opérateurs sont liés à des organes linéaires 
invariants dans le temps : si on décale dans 
le temps l’action exercée sur un tel organe, 
sa réponse subit le même décalage. Dans 
la terminologie moderne, ce sont des 
opérateurs de convolution. Par exemple, la 
dérivation est la convolution par la dérivée 
de la mesure de Dirac. 

Le calcul symbolique a été justifié sur le 
plan théorique grâce à l’utilisation de la 
transformation de Laplace. Celle-ci associe 
à une fonction à support positif une 
fonction d’une variable complexe p. Un 
opérateur de convolution se transforme en 
un opérateur de multiplication par une 
fonction F de la variable complexe p. 
Enfin, grâce à la théorie des distributions, 
cette fonction F peut elle-même être consi- 
dérée comme la transformée de Laplace de 
l’élément par lequel se fait la convolution. 
La transformation de Laplace opérant sur 
des éléments (fonctions ou distributions) à 
support positif, c’est à l’étude des régimes 
transitoires que le calcul symbolique est 
utilisé. Pour les systèmes à temps discret, 
une forme analogue de calcul symbolique 
a été développée sous le nom de transfor- 
mation en Z. Parmi les aspects qui ne 
pourront pas être traités ici, citons l’appli- 
cation aux systèmes différentiels à coeffi- 
cients variables, l’application à la résolu- 
tion de certaines équations aux dérivées 
partielles, la transformation de Laplace à 
plusieurs variables et les aspects numéri- 
ques de l’utilisation de la transformation 
de Laplace. 
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Transformation de Laplace 
des fonctions et des mesures 

Soit f une fonction à valeurs réelles ou 
complexes définie sur l’ensemble R des 
nombres réels et nulle pour les valeurs 

strictement négatives de la variable (c’est- 
à-dire que f est une fonction « à support 
positif »). Sa transformée de Laplace est la 
fonction £/ de la variable complexe p 
définie par la formule : 

V(P) = j o + °°me~p'dt. 

De même si p est une mesure (cf. 
INTÉGRATION ET MESURE) Slir R à SUppOtl 
positif, c’est-à-dire telle que JLl(cp) = 0 pour 
toute fonction (p nulle pour les valeurs 

positives de la variable, sa transformée de 

Laplace est la fonction £p de la variable 

complexe p définie par la formule : 

£g(/?) = 

si p est une mesure de densitéfpar rapport 
à la mesure de Lebesgue, alors on a 
£p = tf On notera par la suite Y la fonc- 
tion définie par Y(t) = 1 si î ^ 0 et 
Y(/) = 0 si t < 0. On voit par un calcul 
élémentaire que la transformée de Laplace 
de Y est 1 )p. Plus généralement, la trans- 
formation de Laplace de f(t) = Y( t)e ht est 

1 /(p-A). 

Au lieu du symbole £ pour représenter 
la transformation de Laplace, on utilise 
souvent un symbole, par exemple 7, pour 
relier les expressions analytiques d’une 
fonction et de sa transformée de Laplace. 
On écrira par exemple : 


et dans de nombreux ouvrages on SOUS- 
entend le facteur Y(t). 

En fait, la transformée de Laplace 
d’une mesure p n’est définie que pour les 
valeurs dep pour lesquelles la fonction e pt 
est intégrable par rapport à P- On a le 
résultat suivant, facile à démontrer. 

Théorème 1. Il existe un nombre tel 
que la fonction e~ pt soit intégrable par 
rapport à p pour Rep > et non inté- 
grable pour Rep < £ 0 , en désignant par 
Re p la partie réelle de p. 

Le nombre est appelé abscisse d’inté- 
grabilité. Il peut être égal à + oc ou à — oo. 
Pour une fonction f, on supposera f 
intégrable sur tout intervalle fini, de sorte 
que / est la densité d’une mesure p. 
L’abscisse d’intégralibilité de £p est appe- 
lée abscisse de convergence absolue de £/ Si 
Re p > l’intégrale : 

j + “e-r'f(t)dt 

est absolument convergente, et, si 
Rep < £o> cette intégrale n’est pas abso- 
lument convergente (elle peut être diver- 
gente ou « semi-convergente »). Par exem- 
ple, si f(t) = Y {t)e h \ on a ç 0 = Re A. En 
fait, on a trouvé que : 

c’est une fonction holomorphe pour Rep 
> Re À, et elle se prolonge de façon 
naturelle au plan complexe. D’une façon 
plus générale, on a le résultat fondamental 
suivant. 

Théorème 2. La transformée de Lapiace 
d’une mesure p est une fonction holomor- 
phe pour Rep > ç 0 (abscisse d’intégrabi- 
lité). La dérivée k-ième de £p est donnée 
par : 

(C M )<*>(p) = (— 1)*[C (f*n)]<p). 
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Ainsi, avec f(t) 7 F(p), on a : 

(“07X0 7 F ( *W. 

En particulier, si p est à support com- 
pact, c’est-à-dire si toutes les fonctions 
continues sont p-intégrables, alors sa trans- 
formée de Laplace est une fonction 
entière. 

Théorème 3. Avec \\(dt) 7 F(p), on a : 


V sont de densités / et g par rapport à la 
mesure de Lebesgue, alors p * v est de 
densité /* g, où : 

= J/(* — u)g{u)du 

est le produit de convolution des fonctions 
/ et g- 

Théorème 5. Si p * v désigne le produit 
de composition de deux mesures p et v à 
support positif, on a : 


autrement dit : 


C(p * v) = CgCv 


[C(é?"m)](/>) = Cjufc— X). 

Théorèmes 4, dits théortmes de la valeur 
finale et de la valeur initiale. Soit f une 
fonction à support positif ayant pour 
transformée de Laplace F, on a les résul- 
tats suivants : 

a) Si/a une limite à droite pour t — 0, 
alors on a : 


pour les valeurs de la variable dont la 
partie réelle est supérieure aux deux abs- 
cisses d’intégrabilité. 

Soit alors f une fonction à support 
positif, continûment dérivable pour t > 0, 
continue à droite pour t — 0. On a : 


/(O = 


/( 0 ) + 

o, 


'/'(«)</ e, 
0 


t ^ 0, 
/ < 0 ; 


lim f(t) = limpF(p). 

r— + 0 pSR 

b) Si/a une limite pour t — ► + oo, alors 
l’abscisse de convergence absolue £ 0 est 
négative ou nulle, et l’on a : 

lim f(t) = lim p¥(p), 
t— + o 

P '0 


ce qui s’écrit aussi : 


/=Y/(0)+Y»/', 


d’où : 


C/» = V(0) + ;£/', 

P P 


c’est-à-dire : 


Avant de donner la propriété principale 
de la transformée de Laplace des mesures, 
rappelons la définition suivante. Si p et V 
sont deux mesures sur R à support positif, 
alors : 

p*v:9^JJ(p(x+ 

est une mesure sur R à support positif, 
appelée le produit de convolution des 
mesures p et v (c’est un cas particulier du 
produit de convolution de deux distribu- 
tions ; cf. DISTRIBUTIONS, chap. 3). Si p et 


w(p)=ptm-m- 

Si l’on a/(0) = 0, on trouve la formule 
simplifiée : 

V'(P) =/>£/(/>); 

ce sont les discontinuités pour t = 0 qui 
compliquent les formules liant les trans- 
formées de Laplace d’une fonction à celles 
de ses dérivées. Or, la dérivation au sens 
des distributions fait intervenir ces discon- 
tinuités et permet, par suite, de conserver 
à ces formules leur forme la plus simple. Si 
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D désigne la dérivation au sens des distri- 
butions (cf. DISTRIBUTIONS , chap. 3), On 
aura : 

D/ = /’+/(0)5, 

ô étant la distribution de Dirac, et. par 
suite : 

W)0>) -/>£/(/>)• 

Transformation de La place 
des distributions 

Soit T une distribution à support positif 
telle que T = D k f où / est une fonction 
pour laquelle C/ a une abscisse de conver- 
gence absolue Ç 0 ^ oo. On posera : 

CTQ>) — p k ^f{p) 
pour R ep > £ 0 . 

On montre aisément la cohérence de 
cette définition et la compatibilité avec les 
définitions antérieures. On obtient en par- 
ticulier CÔ ( ^(/?) = p k . La généralisation 
aux distributions possédant la propriété 
indiquée des règles obtenues pour les 
fonctions et les mesures est aisée et donne 
les résultats suivants : 

a) La transformée de Laplace d’une 
distribution T est holomorphe dans un 
demi-plan Rep > a, et l’on a : 

(CT) ' = - C(*T). 

b) On a : 

£(T * U) = £T CU ; 

en particulier si l’on fait U = on 
obtient : 

£(D*T)(p)=p*CT(p). 

c) On a : 

l(e»T)(p) = CT@-h) . 


T 

CT 

T 

CT 

5 

1 

S' B 

e-°Pp 

S, 

e -*P 


P k 

8' 

P 

Y 

Vp 


T 

CT 


pXf 

1 


e 

p — X 


i 

1 


- siruo t 

CO 

p 2 + CO 2 


COS (ùt 

P 

P 2 + CO 2 

Y(0 X 

t* 1 

1 


r ( «) <a >0) 

P* 


i 



✓* 

\Tp 



1 


r(«) <a > 0) 

C 

</>-*>■ 


tabl. i ■ Transformées de Le pl a c e /es plus 

usuelles 


Le tableau 1 donne les transformées de 
Laplace les plus usuelles. 

Relations entre la transformation 
de Fourier et la transformation 
de Laplace 

Dans ce chapitre, nous utiliserons la for- 
mule suivante pour définir la transforma- 
tion de Fourier d’une fonction / (cf. analyse 
HARMONIQUE , Chap. 3) l 

W)00 = f + 7 (x)e--ydx. 

J — ce* 

De la formule : 

(c/)(p) = | o + 7(0 

supposée valable pour Re p > (abscisse 
de convergence absolue), il résulte que : 

(C/)(£ + it|) = [ + 7(0 e-^e^dt 

Jo =[?(/( f>c-ïO](n). 
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Cette formule se généralise sans diffi- 
culté aux distributions. Avec T = D k f où 
f admet une transformée de Laplace défi- 
nie pour Rep > £ 0 , on aura, pour tout 

e>üo, 

CT(E + <n) = [-7(T e - °)](n)- 

En particulier, si £ 0 < 0, on aura : 
CT(/n) = ^T(n). 

La transformée de Laplace apparaît 
donc comme une extension convenable au 
plan complexe de la transformée de Lou- 
rier qui, elle, est une fonction de variable 
réelle. 1 1 convient de rappeler que cette 
extension n’a pu se faire que moyennant 
l’hypothèse que l’élément auquel on appli- 
que la transformation de Laplace était à 
support positif. Étant donné que la trans- 
formation de Lourier est injective, il en 
sera de même de la transformation de 
Laplace. On peut même reconstituer une 
fonction à partir de sa transformée de 
Laplace supposée connue sur une verticale 
du plan complexe d’abscisse Ç > £ 0î abs- 
cisse de convergence absolue. On aura en 
général, compte tenu de la formule de 
réciprocité de la transformation de Lou- 
rier, 

m =MTS~ ¥{p)eP ' dp ' 

où l’intégrale figurant au second membre 
est prise dans le plan complexe sur la 
verticale d’abscisse L’holomorphie de L 
permet de modifier le chemin d’intégra- 
tion. On peut également rechercher des 
conditions suffisantes assurant qu’une 
fonction F(/?) soit la transformée de 
Laplace d’une distribution. On a alors le 
résultat simple suivant. 

Théorème . Si F(p) est holomorphe pour 
Re p > c et vérifie F(/?) ^ C p alors 
F est la transformée de Laplace d’une 


distribution. Si l’on peut prendre 
m = 2, alors F est la transformée de 

Laplace d’une fonction. 

Applications 

de la transformation de Laplace 
L’application la plus répandue de la trans- 
formation de Laplace est la résolution des 
équations de convolution, et en particulier 
des équations différentielles linéaires à 
coefficients constants. Soit l’équation de 
convolution a * X = où a, b et x sont des 
fonctions à support positif. Si a, b, sont des 
transformées de Laplace A, B, X, on aura : 

A (p)X(p) = B {p\ 

c’est-à-dire : 

X(p) = B(p)/A{p). 

La résolution de l’équation de convolu- 
tion se ramène donc à la résolution d’une 
équation algébrique et à la recherche d’un 
élément ayant une transformée de Laplace 
donnée. Il est intéressant de noter que, pour 
les distributions à support positif, la C011VO- 
lution n’a pas de diviseurs de zéro. Une 
équation de convolution sur R ( ne peut 
donc avoir qu’une solution. Si l’usage de la 
transformation de Laplace fournit une solu- 
tion (c’est-à-dire si a et b ont des transfor- 
mées de Laplace et si B(p)/A(p) est la trans- 
formée de Laplace d’une distribution), 

celle-ci est l’unique solution de l’équation. 
Exemple 1. Soit à résoudre l’équation 

différentielle : 


avec les conditions initiales : 

dx 

x(0) = 1, — (0) = 2. 

at 

Si l’on ne s’intéresse qu’aux valeurs de 
x(î) pour t ^ 0, on peut aussi bien suppo- 
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ser x(î) = 0 pour t < 0, à condition natu- 
rellement de supposer que le second mem- 
bre est remplacé par 0 pour t < 0. Les 
conditions initiales indiquent alors des 
discontinuités de x(t) et de dx/dt pour 
t = 0 ; et, pour en tenir compte, il suffit 
d’introduire les dérivées au sens des dis- 
tributions : 


D .,- D (|)*6 -,g* 2 6 *r. 

L’équation différentielle se récrit alors : 
(D 2 x — 2 ô — ô') + * — Y(0 e { > 
c’est-à-dire : 

D 2 x + x = Y (t) e‘ + 2 5 + ô'. 


Soit X la transformée de Laplace de X. 
On obtient : 

( P 2 + 1)X(P) ^1^+2+p, 


d’où : 

X( n) _ P 2 +P—l 1 

^“(p 2 + l)(p-l) 2(p — 1) 

+ P / 2 | 3/2 

p 2 + 1 p 2 + 1 

et : 

1 1 3 

x(t) = -£< + -cosr + -sin/, t ^ 0. 

Exemple 2. Soit à résoudre l’équation : 

J f sin(t — 0)x(0)üf0 = t 2 , t >0, 

avec x iüjqypAyrC ’proVitf .Ç’est UHC équation 
de convolution a * x = b, avec 
ü(î) = Y(t) sin t et h(t) = Y (t)t 2 . En pre- 
nant les transformées de Laplace, on 
obtient : 


1 

P 2 + 1 



d’où l’on déduit : 

X(p) = - + -V x(t) = Y(/)(2 + t 2 ). 

P P 

Exemple 3. En automatique, tout 
organe linéaire invariant dans le temps 
établit une relation de la forme s —f * e 
entre l’entrée e et la sortie s. Pour des 
raisons physiques, /est à support positif. Si 
S, F, E sont les transformées de Laplace de 
5, /, e , alors on S (p) = F(p)E(p ), et F est 
appelée la fonction de transfert de l’organe. 
Dans le cas d’un système constitué de 
différents organes reliés entre eux, on 
obtient facilement la fonction de transfert 
F du système à partir de celles Fj, F 2 , 
des différents organes. Par exemple, pour 
le système représenté par la figure, on a : 

(F,0»)B0>)-F j (p)Sû»))F 1 Cp)= s (p), 



d’où : 


= S (p) _ F 1 (p)F 2 (p) 

E (P) l + F>(p)Fz(p) 


Transformation en z 

Soit a une suite réeiie ou complexe définie 
sur l’ensemble N des entiers positifs ou 
nuis. On appelle transformée en z de cette 
suite la fonction de variable complexe : 


4 «-i 

n — 0 


a(n) 
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Il existe R £= [0, -J- oc] tel que cette série 
soit absolument convergente pour 
| Z | > R. Le produit de composition 
C = a * b de deux suites a et b sur N est 
défini par : 

c ( n ) = a{p)b{q ), 

p + q = n 

et les transformées en z de a, b, c sont liées 
par la relation C(z) = A(z)B(z). En parti- 
culier, l’opérateur dit opérateur d’avance- 
ment E, qui associe à toute suite a la suite 
Eu telle que Eu(n) — a(n ™ 1), est un 
opérateur de convolution : 

Ea = a * ôj, 

où Ô4, est la suite égale à 1 pour n — k et 
nulle ailleurs. 

En posant b = Eu, on a la relation entre 
les transformées en z de a et b : 

B(z) = - A(z). 

Z 


Le tableau 2 donne quelques transfor- 
mées en z de suites simples. L’utilisation 


o(n) 

A (z) 

8* 

1/z* 

A" 

z/(z - X) 

n 

*!{*- D 2 

n 2 

Z(Z + 1 )/(Z- 1)3 

sin ntù 

z sin6)/(z 2 — 2z cosw + 1 ) 

c 0 S " 0 

(z 2 — Z COS 6>)/(z 2 — 2z costo + 1) 

tabl. 2 

suites 

- Quelques transformées en z de 

simples 


pratique de la transformation en z suppose 
de disposer de tables beaucoup plus impor- 
tantes. 

L’usage de la transformation en z per- 
met la résolution des équations de récur- 


rence linéaires à coefficients constants et 
plus généralement des équations de convo- 
lution sur N. Pour l’inversion de la trans- 
formation en z, on utilise généralement 
l’intégration dans le plan complexe. La 
transformation en z est largement utilisée 
pour l’étude des systèmes asservis à temps 
discret (souvent dénommés « échantillo- 
ns »). 

ROBERT PALLU DE LA BARRIÈRE 
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I ntroduit en 1900 par G. Ricci-Curbas- 
tro et T. Levi-Civita, le calcul tensoriel 
est un puissant outil de l’analyse mathé- 
matique ; très utile en mécanique classi- 
que, il est indispensable en mécanique 
relativiste. 

Dans le présent article, E est une variété 
différentiable de dimension n. Rappelons 
rapidement ce que cela signifie. Au voisi- 
nage de chaque point m q de E, on peut 
trouver un système de coordonnées loca- 
les, c’est-à-dire repérer chaque point m par 
ses n coordonnées w*(m), .... u n (m). Mais, 
au voisinage de Wq, il existe une infinité de 
systèmes de coordonnées raisonnables ; 
aucun d’eux ne joue, a priori, un rôle 
particulier. Notons v ! (w), .... v /? (m) les 
coordonnées de m pour un autre système ; 
il existe n fonctions indéfiniment dériva- 
bles ip 1 , ip'\ définies sur un ouvert de E,„ 
telles que, pour tout point m voisin de ra 0 
et pour tout y, 1 ^ ^ n, on ait : 

W(m)=ijv(w 1 (m) y . . u n (m)). 


Pour étudier la variété E, on choisit 
un système de coordonnées dans lequel 
on va faire les calculs ; dans les formules 
que l’on écrira, on distinguera d’une part 
ce qui dépend du système de coordonnées 
choisi, et qui est en général dépourvu 
d’intérêt, d’autre part ce qui décrit des 
phénomènes intrinsèques. Parmi les plus 
importants des objets que l’on peut asso- 
cier à une variété se trouvent les tenseurs. 
On se propose ici de les décrire dans 
un système de coordonnées et de voir 
comment cette description varie si l’on 
change de système. On appliquera ensuite 
ces calculs à l’étude des variétés 
pseudo-riemanniennes, en donnant des 
formules explicites pour la dérivée COVa- 
riante. 


* 


1. Champs de vecteurs 
et formes de degré 1 

Soit un système de coordonnées u\ . . . . u n 
au voisinage du point m 0 de E, de coor- 
données Wq, . . . . Uq. Toute fonction numé- 
rique / définie sur E au voisinage de 
apparaît comme une fonction f u de H 
variables réelles : le nombre f u (uK . ... u n ) 
est la valeur def au point de coordonnées 
u\ ..., u n . On dit que /est de classe Coo si 
f u est une fonction de classe C°o d’un 
ouvert de E,, dans R. Cette définition 
semble privilégier un système de coordon- 
nées, mais il n’en est rien : en utilisant le 
fait que les changements de coordonnées 
sont de classe (?/ on démontre que, pour 
tout autre système de coordonnées v\ . . . . 
v n qui à/ associe la fonction de n variables 
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/*’, la fonction f u est de classe Q x si et 
seulement si f v est de classe C*. 

Un champ de vecteurs sur E (ou, plus 
précisément, un champ de vecteurs de 
classe C* 5 cf. équations aux dérivés 
partielles, chap. 1 ) est une corres- 
pondance X qui à toute fonction f de classe 
C x associe une fonction X(f) de classe 
C x et vérifie les trois conditions suivan- 
tes : 

a) Si f et g coïncident au voisinage d’un 
point m, alors X(f) et X(g) coïncident au 
voisinage de m ; 

b) X(f+ bg) = X(f) + AXfe), OÙ À 

est une constante ; 

c)X(fg)=X(f)g+fX(g). 

On définit sur l’ensemble des champs de 
vecteurs une structure de module sur 
l’anneau des fonctions de classe (cf. 
algèbre linéaire et multilinéaire, 
chap. 9) en posant : 

(X + q>W) = W) + tpYCO 

pour toute fonction f En associant à toute 
fonctionna fonction df U jdu\ on définit un 
champ de vecteurs, que l’on notera d/du'. 
On montre que les n champs ainsi obtenus 
forment une base du module des champs ; 
c’est-à-dire que, pour tout champ de vec- 
teurs X, il existe une famille X 1 , X n de 
fonctions de classe (?“, et une seule, telle 
que : 



les X 1 sont appelées les coordonnées du 
champ X dans le système de coordonnées 

Une forme de degré 1 est une corres- 
pondance o) qui à tout champ de vecteurs 
X associe une fonction o(X) de classe Coo 
et vérifie la condition suivante : 


d) Pour tout couple (X, Y) de champs 
de vecteurs et toute fonction cp de classe 
G 30 , on a : 

G)(X + <pY) _ w(X) + <pw(Y). 

Une forme de degré 1 est donc une 
application linéaire du module des champs 
dans l’anneau des fonctions de classe Uoo. 
En posant : 

(o) + <po>')(Y) = <i>(Y) + qxa'OO 

pour tout champ de vecteurs Y, on munit 
l’ensemble des formes de degré 1 d’une 
structure de module sur l’anneau des 
fonctions de classe Coo. La correspondance 
X ► X(f) est une forme de degré 1 pour 
toute fonction/ de classe Ccc ; on l’appelle 
la différentielle de / et on la note df. Soit 
u l la fonction qui à tout point m associe sa 
/- ième coordonnée u'(m) dans le système 
(u\ . u n ) ; les formes du’, ... . du n cons- 
tituent une base du module des formes de 
degré 1, c’est-à-dire que, pour toute forme 
D, il existe une famille C0j , . . . . (i)„ de 
fonctions de classe et une seule, telle 
que : 



1 


Les fonctions G),- sont appelées les coor- 
données de la forme g) dans le système (/, 

. . . . u n ). On vérifie que : 



Il en résulte que la valeur de la 
forme : 



/= 1 
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sur le vecteur : 



est : 

(4) o(X) = ^ o,X'. 


respectivement les fonctions X’, X' ; , G); et 
Ci/y, on a : 



1 = 1 


n 

X' = ^ p; xv 

^ a' a). 

i - 1 


Changement de coordonnées 

Soit maintenant un nouveau système de 
coordonnées (y 1 , . . . . v' 7 ). On a des fonctions 
de changement de coordonnées (p 7 et ip 7 
telles que, pour tout w, on ait respective- 
ment : 

w ' (w ) = cp'(v 1 (m), v n (m )), 

W(m) = ^m), ....«"(m)). 

Posons : 

P^(u l (m), . . u"(m))= a 3 (m), 

ou 1 

^r(v'(m), ...,v»(m)) = P'(m). 

Les matrices : 

a(m) = (o P(«) = (P}(«)) 


sont inversibles et inverses l’une de l’autre ; 
on démontre les formules : 



/=i i=i 


De ces formules on déduit que, si G) est 
une forme de degré 1 et X un champ de 
vecteurs dont les coordonnées dans les 
systèmes (w 1 , . . . . u n ) et (v 1 , . . . . V 71 ) sont 


2. Tenseurs 

Tenseurs covariants 

Un tenseur covariant à p variables T est une 
fonction, définie sur l’ensemble des systè- 
mes de p champs de vecteurs et à valeurs 
dans l’anneau des fonctions de classe C 30 , 
qui est linéaire par rapport à chacune de 
ses variables, c’est-à-dire qui vérifie, pour 
tout k tel que 1 ^ k /?, la condition 
suivante : Pour tout système de vecteurs 
(X„ X /; ), avec X k — Y+ cpZ où (p est 

une fonction de classe (?“, on a : 

t(X„...,X,) 

= T (Xi, X*_j, Y,X*+ . ..jXp) 

+cp r (Xi,. . . . X*_ lf z, Xjfc + j, X,) 

Soit (O J , . . . . i.o p un système de p formes 
de degré 1. En associant à tout système de 
champs (X,, X ;) ) le produit : 

on définit un tenseur covariant à p varia- 
bles que l’on note : 

Ü j 0 0 {ù p . 

En particulier, si l’on s’est donné un 
système de coordonnées (w 1 , . . . . w 77 ), alors, 
pour tout système i = (i j, . . . . i p ) d’indices 
compris entre 1 et /î, on a un tenseur : 

du 1 ' ® ... ® du‘p ; 
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on montre que les n p tenseurs ainsi définis 
forment une base du module des tenseurs 
covariants à p variables ; c’est-à-dire que, 
pour tout tenseur covariant à p variables r, 
il existe une famille (t /( , ) de nP fonctions 

de classe et une seule, telle que : 

(7) r = T iy i? du^ ® ... ® duh ; 

les fonctions T, , sont les coordonnées 

'h <'p 

du tenseur dans le système de coordonnées 
choisi. 

Si l’on se donne un autre système de 
coordonnées (v 1 , . . . . v"), les formules (5) 
entraînent les formules (8) figurant dans le 
tableau. 

On en déduit qu’entre les coordonnées 
T, t , du tenseur dans le système de 
coordonnées (w 1 , . . . . u n ) et ses coordonnées 


T y /o dans le système de coordon- 

nées (v 1 , . . . . V*) on a les relations (9) du 
tableau. 

Tenseurs contravariants 
De la même façon, on appelle tenseur 
contravariant à p variables une applica- 
tion, linéaire par rapport à chaque varia- 
ble, de l’ensemble des systèmes dep formes 
de degré 1 dans l’anneau des fonctions de 
classe C 00 . Pour tout système d’indices 
/=(/},. . . . i } ,), on définit le tenseur : 

a a 

X~T ® ® T— r 


par la formule : 



8 

du 1 1 ® . . . 0 du'P = ^ 

•• ^ ••• 



dvh ® ... ® dvh = 


® du f p 





9 

* 2 • 

i<« 

•• 2 '> 



** >>- 2 • 

•• 2 v 


10 

- Z 


®TJ 

10 

Tii ip= 2 ■■ 

K;i «« 




tVi ip= 2 •• 

• ^ -a^T'i ■> 
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Les n p tenseurs ainsi définis forment 
une base du module des tenseurs contra- 
variants à p variables ; donc, pour tout 
tenseur contravariant à p variables T, on a 
une famille (r M " " ip ) de fonctions de classe 
(?*, et une seule, telle que la relation (10) 
du tableau soit satisfaite : les fonctions 
T' 1, 'p sont les coordonnées du tenseur 
dans le système de coordonnées (w 1 , . . . . u n ). 

Si maintenant les fonctions t' J] } p sont 

les coordonnées de T dans le système 
(v 1 , . . . . v"), on a les relations (10’) du 
tableau. 


Tenseurs de variance mixte 
Soit (I, J) une partition de l’ensemble 
des entiers compris entre 1 et p. Un 
tenseur T de variance (I, J) est une fonction 
de p variables (A„ A„), linéaire par 

rapport à chacune d’elles, où A„ est une 
forme de degré 1 si a G I et un champ de 
vecteurs si a G J. L’ensemble 1 est 
l’ensemble des indices contravariants de T 
et J l’ensemble des indices covariants. 
Chaque système de coordonnées (h 1 , 
u n ) définit une base (ayant n p éléments) du 
module des tenseurs de variance (I, J) ; 
donc T est déterminé, dans le système de 
coordonnées choisi, par n p fonctions coor- 
données. 

Par exemple, pour p = 3, un tenseur T 
de variance ({ 1, 3}, 2) associe à tout triplet 
(«, X, 7 r), où X est un champ de vecteurs 
et (0, 7 T des formes de degré 1, une fonction 
t((l), X, 7 T). Pour tout triplet (/,, / 7 , / 3 ) 
d’indices compris entre 1 et n , en associant 
à (o), X, tt) la fonction produit : 

on définit un tenseur de variance ({ 1, 3 }, 
2), que l’on note : 


les tenseurs de ce type forment une base, 
c’est-à-dire que, T étant donné, il existe une 
famille et une seule de n~ fonctions de 
classe Coo, que l’on notera (t / 1 ' 3 ), telle que : 


n 



du 1 ' 


® du ‘2 ® 


_d_ 

du‘i 


Conventions de sommation 
Dans tout ce qui précède, on a décrit un 
certain nombre de familles d’objets : bases 
du module des champs ou du module des 
formes de degré 1 ; coordonnées des 

champs, des formes, des tenseurs ; déri- 
vées partielles des changements de coor- 
données. Les objets de chacune de ces 
familles sont alors repérés par un ou 
plusieurs indices compris entre 1 et n. On 
a placé certains de ces indices en haut, 
d’autres en bas. A priori, le choix de la 
place de ces indices paraît assez arbitraire ; 
il n’en est rien. En effet, si on regarde 
toutes les formules de sommation qui ont 
été écrites, on constate que (à condition de 
considérer que, dans ôjdu\ l’indice i est en 
bas) : 

a) Chaque fois qu’on a sommé par 
rapport à un indice, celui-ci apparaît deux 
fois dans la formule, une fois en haut et une 
fois en bas ; 

b) Chaque fois qu’un indice apparaît 
deux fois, il est une fois en haut et une fois 
en bas, et on somme par rapport à lui. 

Ces deux remarques permettent de 
retrouver assez facilement toutes les formu- 
les que l’on a écrites et, d’autre part, d’éli- 
miner celles qui n’ont aucun sens intrinsè- 
que. Par exemple, si on a deux champs X et 
Y de coordonnées X' et Y’ dans un certain 
système, on n’écrira jamais : 

i * y ' 
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car cette quantité dépend du système de 
coordonnées choisi ; mais, si 0) est une 
forme de degré 1, de coordonnées G),, la 
somme : 

I°’ x ’ 

l 

est indépendante du système de coordon- 
nées choisi. 

On utilise cette convention pour l’écri- 
ture des tenseurs ; on écrit les indices 
contravariants en haut et les indices C0Va- 
riants en bas. C’est ce que l’on a fait dans 
les exemples cités plus haut. 

Comme les sommations que l’on doit 
faire sont indiquées par les indices, on 
prend l’habitude de supprimer les signes Z 
de sommation ; c’est la convention d'Eins- 
tein . Ainsi, les formules (9) s’écrivent : 


La sommation par rapport aux indices 
j dans la première formule et par rapport 
aux indices / dans la seconde est indiquée 
par le fait que chacun de ces indices se 
trouve une fois en bas et une fois en haut. 

La contraction 

Ce principe de sommation, énoncé pour 
des indices de deux tenseurs différents, 
s’étend aux indices d’un même tenseur. 
Considérons, par exemple, un tenseur j à 
quatre indices, de coordonnées Tjjj dans un 
certain système de coordonnées ; les quan- 
tités Tjjj, c’est-à-dire : 



sont les coordonnées d’un tenseur à deux 
variables, appelé le contracté de T par 
rapport aux deux premiers indices. De 
façon générale, chaque fois qu’un tenseur 


a un indice covariant et un indice contra- 
variant, on peut les contracter et on obtient 
ainsi un tenseur qui a deux variables de 
moins que le tenseur que l’on contracte. 

3. Variétés pseudo-riemanniennes 

Nous écrirons désormais toutes les formu- 
les dans un système de coordonnées fixe 
( m 1 , . . . . u n ), d’ailleurs arbitraire. Soit g un 
tenseur covariant à deux variables qui est 
symétrique, c’est-à-dire que g(X, Y) == 
g( Y. X) quels que soient X et Y. Les 
valeurs en un point m des coordonnées g„ 
de g forment une matrice carrée d’ordre n , 
et le déterminant de cette matrice dépend 
du système de coordonnées choisi ; mais, 
s’il est nul dans un système, il l’est dans 
tous les autres. Si ce déterminant ne 
s’annule en aucun point m, on dit que g est 
une structure pseudo-riemannienne sur E. 
Dans ce qui suit, on fixe une fois 
pour toutes une structure pseudo-rieman- 
nienne g. 

Soit X un champ de vecteurs ; la cor- 
respondance qui à tout champ de vec- 
teurs Y associe g(X, Y) est une forme de 
degré 1 ; on la note X b . La correspondance 
qui à X associe X b est un isomorphisme du 
module des champs sur le module des 
formes ; elle est donc biunivoque, et : 

(X + cpY) b = X b + qpY b . 

Si on note X’ les coordonnées de X, et 
X ; b celles de X\ on a, en utilisant les 
conventions de notations ci-dessus. 

(11) X b = g ij XK 

Cet isomorphisme b se prolonge au cas 
des tenseurs : Si T est un tenseur dont 
l’indice a est contravariant, on définit un 
tenseur T** 01 ) dont la variance diffère de 
celle de T par le fait que a y est covariant 
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en posant, pour tout système de champs et 
de formes, (..., X, . où l’on n’a pas écrit 
les variables d’indice différent de a : 

tK«)(...,x,. ..) =t(..„ X",. 

les coordonnées î* |H) lu de T”(a) provien- 
nent des coordonnées T ,a " de T, grâce à 
la formule : 

O 2 ) «... = giaia T ,a 

Pour tout m, la matrice des coefficients 
gifin) est inversible ; soit g lJ (m) la matrice 
inverse. Les fonctions g'J sont de classe Coo. 
Avec les conventions de notation que l’on 
a faites, le fait que la matrice (g,(m)) soit 
l’inverse de la matrice (g !l (m)) se traduit 
par la formule : 

( 13 ) g% k =[ o, i*k. 

De cette relation résulte que : 
g iJ gjkga ~ g kl > 


autrement dit, le tenseur g est obtenu à 
partir du tenseur g* de coordonnées g i J par 
application de b (1) et b (2). 

On note # les isomorphismes inverses 
des isomorphismes b et on démontre que : 

a) Pour toute forme 0) de degré 1, on 
a : 

(w # )* = g k J(j)j ; 

h) Pour tout tenseur t dont l’indice Q 
est covariant, on a : 


'a- — g'cüax 

On von* que T on ptïu, grâce aux iso- 
morphismes b et 8, modifier à volonté les 
variances des indices d’un tenseur. En 
particulier, on peut les rendre tous COVa- 
riants ou tous COntravariantS. Les coor- 
données du tenseur covariant associé à j 
sont appelées les coordonnées covariantes 


de T et celles du tenseur contravariant 
associé à T sont appelées les coordonnées 
contravariantes de T. Les g lJ sont donc les 
coordonnées contravariantes du tenseur 
métrique g et les gÿ ses coordonnées 
covariantes. De même les X' sont les 
coordonnées contravariantes du champ X 
et les X, = g„ X' ses coordonnées COVa- 
riantes. 


4. La dérivée covariante 


Soit D une connexion linéaire sur E : à tout 
couple (X, Y) de champs de vecteurs elle 
associe un champ de vecteurs Dx Y tel que 
l’on ait les relations : 


(«) Dx + *x Y = D X Y + 4>D X .Y, 

(P) D X (Y + <|>Y') = D X Y + <|>D X Y' + X(<j))Y. 


Soit X' les coordonnées de X, soit Y’ 
celles de Y et Fj k celles de : 

DÜ 

dui ôu k 

dans le système de coordonnées (w 1 , . . . . u n ). 
Des conditions (a) et (P) on déduit : 

(14) D,v.x-(g + ri,Y-)±. 


Si D est la dérivée covariante, on 
montre que les rj k sont donnés par la 
formule : 


(15) 


T 1 

l jk ■ 


dgki + dgjj dg jk \ 

ôuJ du k du 1 )' 


on les appelle les symboles de Christoffel. 
On remarquera que, contrairement à ce 
qu’une analogie de notations pourrait lais- 
ser penser, les symboles de Christoffel ne 
se comportent pas comme les coordonnées 
d’un tenseur ; c’est-à-dire que, si l’on 
exprime la dérivée covariante dans un 
autre système de coordonnées, on obtient 
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d’autres fonctions F n m qui ne sont pas 
égales à : 

ria'p'a*. 

Ces calculs permettent d’écrire de façon 
très simple le système différentiel des 
géodésiques : Soit y une courbe paramé- 
trée proportionnellement à sa longueur ; 
c’est une géodésique si et seulement si : 

D 0 

U dy/dt df = u > 


c’est-à-dire si, en notant y’ les fonctions 
coordonnées de y, on a : 


( 16 ) 


d 2 y 


. dyi dt „ 

dt dt ~ ’ 


quel que soit i. 


CLAUDE MORLET 
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TOPOLOGIE GÉNÉRALE 


L es notions de continuité et de limite ont 
une origine intuitive et l’on se propose 
d’analyser ici cette intuition. Considérons, 
par exemple, la description de la tan- 
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gente T à une courbe (fig. 1) telle qu’on la 
trouve dans les manuels classiques de 
géométrie élémentaire : Si M varie sur T, 
la corde M 0 M varie continûment et, si M 
tend vers M 0 , la corde M 0 M a une position 
limite qui est T. 



En disant que MqM varie continûment, 
on exprime que, si M s’approche indéfi- 
niment d’un point M,, la droite MqM 
s’approche indéfiniment de la droite 
MqM! ; en disant que M 0 M a une position 
limite T, on exprime que, si M s’approche 
indéfiniment de M 0 , la droite M 0 M 
s’approche indéfiniment de T. On peut 
donc donner les définitions suivantes : 

- L’applicationfde X dans Y est continue 
en Xj si une condition suffisante pour que 
f(x) soit voisin de/(x } ) est que x soit assez 
voisin de ,Yj ; 

- L’application f de X x 0 dans Y a une 
limite en x 0 , si une condition suffisante 
pour que f (x) soit voisin de y 0 est que x soit 
assez voisin de x 0 . 

Pour que ces définitions deviennent des 
définitions mathématiques, il faut donner 
un sens précis aux termes « f (x) voisin de 
f (*i) (ou de Vq) » et « x assez voisin de x ( 
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(ou de Xq) ». Dans les chapitres 1 et 2, on 
s’occupera d’abord de définir cette notion 
de voisinage, puis on donnera les princi- 
pales propriétés des fonctions continues et 
des limites. Les chapitres 3 et 4 seront 
consacrés à l’étude de deux classes d’espa- 
ces topologiques très importantes, les espa- 
ces compacts et les espaces connexes. 

La notion d’espace topologique 
contient en particulier celle d’espace métri- 
que (cf. espaces MÉTRIQUES) dont l’étude 
est une excellente introduction à la topo- 
logie générale. 

1 . Espaces topologiques 

Voisinages et continuité 

On a vu que, pour définir les notions de 
limite et de continuité, on devait donner un 
moyen de savoir si deux points sont voisins 
(resp. assez voisins). Pour cela, il est assez 
naturel de mesurer la distance de CCS deux 
points. On peut donc parler de continuité 
ou de limites pour les applications de X 
dans Y, si l’on a défini la distance entre les 
points de X et la distance entre les points 
de Y, c’est-a-dire si X et Y sont des espaces 
métriques (cf. espaces MÉTRIQUES). 

Ce point de vue est suffisant tant que Xet 
Y sont R, R /J , les surfaces de R 3 , etc. , et, plus 
généralement, pour tous les problèmes géo- 
métriques. C’est l’analyse qui a mis ses lacu- 
nes en évidence ; il arrive, en effet, que l’on 
dispose d’applications de R^ dans un 
ensemble de fonctions E qui, pour des rai- 
sons propres au problème à résoudre, doi- 
vent être considérées comme continues, 
mais qu’il n’existe aucune métrique sur E 
qui les rende continues. Il faut donc donner 
un moyen, autre que la distance, pour savoir 
si deux éléments a et b de E sont voisins. 

Pour cela, on se donne une famille / ü de 
sous-ensembles de E que l’on appelle les 


voisinages de a dans E ; pour dire « com- 
ment b est voisin de a », on dit dans quel 
voisinage de a il se trouve. Si, pour tout 
élément a de E, on a défini les voisinages de 
a dans E, on dit que E est un espace topo- 
logique ; les éléments de E sont alors appe- 
lés des points. Si E et F sont deux espaces 
topologiques et sifest une application de E 
dans F, on dit quefest continue au point a 
de E si : Pour tout voisinage V de/ ( a ) dans 
F, il existe un voisinage W de a dans E tel 
que, pour tout point b de W, le point f (b) 
soit dans V. On dit quefest continue si elle 
est continue en chaque point de E. Tout 
espace métrique X devient naturellement 
un espace topologique si l’on choisit pour 
voisinages d’un point x les sous-ensembles 
de X qui contiennent une boule de centre x 
et de rayon strictement positif. On vérifie 
alors que, si X et Y sont métriques, pour une 
application j de X dans Y les deux défini- 
tions de la continuité que l’on a données 
coïncident. 

On impose aux voisinages de vérifier les 
quatre conditions suivantes : 

(V,) Tout voisinage de a contient a ; 

(V 2 ) Tout sous-ensemble de l’espace E 
qui contient un voisinage de a est un 
voisinage de a ; 

(V,) L’intersection d’un nombre fini de 
voisinages de a est un voisinage de a ; 

(V,) Pour tout voisinage V de a, il existe 
un voisinage W de a tel que V soit 
voisinage de chacun des points de W. 

Ces conditions permettent d’étendre au 
cas des espaces topologiques les principa- 
le propriétés des fonctions continues de R 
dans R. En particulier, toute somme, tout 
produit et tout quotient de fonctions numé- 
riques continues sont encore des fonctions 
numériques continues. On démontre aussi 
que la composée de deux applications 
continues est une application continue. 
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Ouverts et fermés 

On dit qu’un sous-ensemble U de l’espace 
topologique E est ouvert s’il est voisinage 
de chacun de ses points. Les ouverts d’un 
espace topologique E vérifient les trois 
propriétés suivantes : 

(0,) L’ensemble E et l’ensemble vide 
sont ouverts ; 

(0,) Toute réunion d’ouverts est un 
ouvert ; 

(0,) Toute intersection d’un nombre 
fini d’ouverts est un ouvert. 

La structure topologique d’un espace 
est déterminée par la connaissance de ses 
ouverts ; en effet, les voisinages d’un point 
a de E sont les sous-ensembles de E qui 
contiennent un ouvert qui contient a. 

Il est clair que la donnée des ouverts de 
E est équivalente à celle des SOUS- 
ensembles de E dont le complémentaire 
dans E est ouvert ; ces sous-ensembles sont 
appelés les fermés de E ; ils vérifient les 
trois conditions suivantes : 

(F,) L’ensemble E et l’ensemble vide 
sont fermés ; 

(F,) Toute intersection de fermés est un 
fermé ; 

(F3) Toute réunion d’un nombre fini de 
fermés est un fermé. 

Soit A un sous-ensemble d’un espace 
topologique E. D’après (CK), la réunion de 
tous les ouverts de E contenus dans A est 
un ouvert qui est évidemment le plus grand 
ouvert (au sens de l’inclusion) contenu 
dans A ; on l’appelle Vintérieur de A et on 
le note A. L’intérieur d’un ensemble peut 
être vide sans que cet ensemble le soit, 
comme on le voit en prenant, par exemple, 
pour E l’ensemble R des nombres réels 
muni de sa topologie usuelle, et pour A 
l’ensemble Q des nombres rationnels. Les 
ensembles ouverts sont caractérisés par le 
fait qu’ils sont égaux à leur intérieur. 
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De même, d’après (F 2 ), l’intersection 
de tous les fermés contenant A est un 
fermé A qui est le plus petit fermé conte- 
nant A : on l’appelle la fermeture ou 
Y adhérence de A. On vérifie facilement 
qu’un point .Y G E appartient à A si et 
seulement si, pour tout voisinage V de v. 
on a V H A ^ 0 ; un tel point est dit 
adhérent à A. On dit enfin que A estpurtout 
dense dans E si A = E, ce qui revient à dire 
que tout ouvert non vide de E rencontre A. 

La considération des ouverts et des 
fermés donne une caractérisation très sim- 
ple des applications continues. En effet, 
pour qu’une applicationfde E dans F soit 
continue, il faut et il suffit que, pour tout 
ouvert Y de F, l’ensemble /“ l (V) soit un 
ouvert de E ; ou encore, en termes de 
fermés : pour tout fermé A de F, l’ensem- 
ble /’ _1 (A) est fermé dans E. 

Exemples 

On trouvera dans de nombreux articles 
du présent ouvrage des exemples d’ensem- 
bles munis d’une topologie, Voici quelques 
rappels et exemples complémentaires. 

1. Sur tout ensemble X, on appelle 
topologie grossière la topologie dont les 
seuls ouverts sont X et l’ensemble vide. 
Tout point de X a alors un seul voisinage 
qui est X lui-même. 

2. Il existe une topologie sur X pour 
laquelle tout sous-ensemble qui contient .Y 
est un voisinage de jç; c’est la topologie 
discrète ; tout sous-ensemble de X est alors 
à la fois ouvert et fermé. 

3. Tout espace métrique X a une topo- 
logie naturelle (cf. espaces métriques). Les 
voisinages d’un point x sont les SOUS- 
ensembles de X, qui contiennent une boule 
de centre x dont le rayon est de la forme 1 /fU 
avec n entier. Pour qu’une topologie puisse 
être définie par une métrique, il est donc 
nécessaire que tout point x possède une 
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suite de voisinages (V^. 1 , .... V”, . ..) telle que 
tout voisinage de x contienne l’un des V” ; 
cette remarque permet de montrer que les 
topologies définies aux exemples (6) et (7) 
ci-dessous ne peuvent pas être déduites 
d’une métrique. 

4. Si A est un sous-ensemble de 
l’espace topologique E, les sous-ensembles 
de A de la forme A f| U, où U est un 
ouvert de E, forment les ouverts d’une 
topologie Slir A ; c’est la topologie induite 
sur A par la topologie de E ; muni de cette 
topologie, A est appelé un sous-espace 
topologique de E. 

5. Si E et F sont deux espaces topolo- 
giques, on appelle pavé ouvert de E X F 
les sous-ensembles de la forme U X V, où 
U est un ouvert de E et Y un ouvert de F ; 
les réunions de pavés ouverts sont les 
ouverts d’une topologie sur E X F, appe- 
lée topologie produit. Remarquons que la 
topologie naturelle de R 2 est la topologie 
produit de la topologie de R par elle- 
même. 

6. Soit E l’ensemble des applications de 
R dans R ; pour tout nombre x et tout 
ouvert U de R, notons V(x, U) l’ensemble 
des éléments g de E tels que g(x) appar- 
tienne à U. Parmi les topologies sur E dont 
les V(x, U) sont des ouverts, il en existe une 
qui a le moins d’ouverts ; c’est la topologie 
de la convergence simple. Ses ouverts sont 
les réunions d’intersections finies d’ensem- 
bles V (je, U). 

7. Soit encore E l’ensemble des appli- 
cations de R dans R ; pour Q ouvert de 
R 2 , notons V(Q) l’ensemble des éléments 
g de E tels que, püui lu ut ie point (x, 
g(x)) soit dans Q, Les V(n), lorsque Q 
parcourt l’ensemble des ouverts de R 2 , 
sont les ouverts d’une topologie sur E, que 
l’on appelle la topologie On voit 
facilement qu’une application cp d’un 
espace topologique A dans E, muni de 


cette topologie A°, est continue si et 
seulement si l’application : 

@ :A X R -R , 

qui à (a, t) associe la valeur de <p(a) en /, 
est continue, l’ensemble A X R étant 
muni de la topologie produit (cf. exemple 
5). 

Dans les exemples 6 et 7 précédents, on 
a défini deux topologies distinctes sur 
l’ensemble E des applications de R dans R. 
mais il en existe bien d’autres : topologie 
discrète ; topologie grossière ; topologie de 
la convergence uniforme, définie par la 
distance : 

d (/Ig) = suj>(mf(|/(x)— *(x)|, 1)). 

Sur un ensemble donné, il existe ainsi 
beaucoup de topologies ; pour certains 
ensembles, en particulier pour les ensem- 
bles de fonctions, plusieurs d’entre elles 
ont un réel intérêt ; mais, sur R et sur R", 
on n’utilise pratiquement que l’une d’elles, 
celle qui est déduite de la distance eucli- 
dienne. 

Homéomorphismes 

Une application f de l’espace topologique 
X dans l’espace topologique Y est appelée 
un homéomorphisme si elle est bijective et 
si elle est continue ainsi que son inverse. 

Il est important de noter qu’une applica- 
tion bijective et continue n’est pas nécessai- 
rement un homéomorphisme ; par exem- 
ple, si X est le sous-espace de R formé de 
]a, />[ et des points a et c, avec c > b, l’appli- 
cationfde X dans [ a , h], définie par f (t) = î 
si t # C et f(c) = b , est bijective et conti- 
nue, mais son inverse n’est pas continue. 

Recollements de topologies 

Soit (U,), i G I, une famille d’espaces 
topologiques, et, pour tout i , une injection 
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cp; de U, dans un ensemble E. On suppose 
vérifiées les trois conditions suivantes : 

a) E est la réunion des images des cp,- ; 

b) Pour tout couple (/,y), l’ensemble 
(f t :1 (cpj (U,)) est un ouvert de U, ; 

c) Pour tout couple (/,/), l’application 
cpy l o cpf réalise un homéomorphisme de 
cp ( 1 (q3 y (U,)) sur qH^cp/U,)) comme l’indi- 
que la figure 2. 



Alors, il existe une topologie et une 
seule sur E, telle que, pour tout i, l’appli- 
cation cp,- soit un homéomorphisme de U,* 
sur le sous-espace cp, (U,) de E. Un sous- 
ensemble Q de E est ouvert pour cette 
topologie si et seulement si, pour tout i, 
cp," '(Q) est ouvert dans U,. 

Parmi les topologies définies par ce 
procédé de recollement, citons la topologie 
de l’espace projectif réel P„(R), c’est-à-dire 
de l’ensemble des sous-espaces vectoriels 
de dimension 1 de R/'+ 1 : droites de R ,,+1 
passant sur l’origine. Pour tout sous- 
espace affine U de R' 7+1 qui ne passe pas 
par l’origine, on définit une injection : 

<p : U — * P„ (R) 



Topologie de l’espace projectif réel P 2 (R) 


en associant à n 6 U le sous-espace vec- 
toriel c p(w) engendré par u (fig. 3). Les 
conditions (a), (h) et (c) sont vérifiées. Si 
fl ^ 1 ou 2, l’espace P„(R) s’identifie à 
l’ensemble des droites du plan ou de 
l’espace de la géométrie élémentaire qui 
passent par un point M 0 donné ; c’est la 
topologie que nous venons de décrire qui 
est utilisée quand, dans la définition de la 
tangente, on parle de la limite d’une droite 
passant par M 0 (fig. 1). 

On définit de façon analogue une topo- 
logie sur l’espace projectif complexe 
P„(C), c’est-à-dire sur l’ensemble des SOUS- 
espaces vectoriels de dimension 1 de C" +1 . 


2. Limites 
Exemples 

Dans l’analyse classique, le mot limite peut 
désigner des choses apparemment très 
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diverses dont on va citer quelques exem- 
ples. 

1. Limite d’une suite numérique. Soit 
(x„) une suite de nombres ; on dit qu’elle 
converge et que sa limite est y si, quel que 
soit le nombre strictement positif E, il existe 
un entier N tel que, pour tout n ^ N, on 
ait l’inégalité y x n ^ E. 

2. Limite uniforme d’une suite de fonc- 
tions. Soit (f ) une suite de fonctions 
numériques définies sur un ensemble X ; 
on dit qu’elle converge uniformément et 
que sa limite est g si, quel que soit le 
nombre strictement positif E, il existe un 
entier N tel que, pour tout II ^ N et pour 
tout élément z de X, on ait l’inégalité 

i &)-m <e. 

3. Limite en - 1- oo d’une fonction numé- 
rique définie sur l’intervalle [a, + oo[. Soit f 
une fonction numérique définie sur l’inter- 
valle [a, + oo[ ; on dit qu’elle a une limite 
en + oo et que cette limite est le nombre y 
si, quel que soit le nombre strictement 
positif E, il existe un nombre N tel que 
l’inégalité x ^ sup (a, N) entraîne l’inéga- 

üté y -/ W < e. 

4. Limite à droite en a d’une fonction 
numérique définie sur ] a, b[. Soit f une 
fonction numérique définie sur ] a, b[ ; on 
dit que fa une limite à droite en a et que 
cette limite est y si, quel que soit le nombre 
strictement positif E, il existe un nombre 
strictement positif a tel que, pour tout 
point x qui vérifie a < X ^ Cl CK, on ait 

>’-/(*) 

Filtres 

II existe une certaine parente entre ces 
définitions ; pour dégager ce qu’elles ont de 
commun, H. Cartan a introduit la notion de 
filtre. Un filtre sur l’ensemble A est, par 
définition, un ensemble de parties de A, 
qui vérifie les trois conditions suivantes : 

a) Tout élément de .T est non vide ; 


b) L’intersection d’un nombre fini d’élé- 
ments de 3 e est un élément de F ; 

c) Toute partie de A qui contient un 
élément de F est elle-même un élément de 
3. 

Si f est une application de A dans un 
espace topologique X, on dit que le point 
y de X est limite defsuivant le filtre F si, 
pour tout voisinage V de y dans X, il existe 
un élément F de F tel que f(a ) soit dans 
V chaque fois que a appartient à F. 

Montrons que l’on a obtenu le résultat 
cherché, c’est-à-dire que les quatre notions 
de limites définies plus haut sont des cas 
particuliers de limite suivant un filtre. 

Sur l’ensemble N des entiers naturels, 
les complémentaires des parties finies for- 
ment un filtre F N (que l’on appelle souvent 
filtre de Fréchet). Dire que la suite numé- 
rique (x w ) converge et a pour limite y 
(exemple 1), c’est dire que y est limite de 
la fonction de N dans R qui à n associe X fn 
suivant le filtre f N . 

Dire que la suite de fonctions numéri- 
ques (f n ) converge uniformément et qu’elle 
a pour limite g (exemple 2), c’est dire que, 
si l’on note E l’ensemble des fonctions de 
X dans R et si l’on munit E de la distance 
de la convergence uniforme, g est limite 
suivant le filtre ,T N de l’application de N 
dans E qui à n associe f n . 

Dire que y est la limite de f en + oc 
(exemple 3), c’est dire que y est la limite de 
f suivant le filtre F +oo formé des complé- 
mentaires des parties majorées de 

[«, + =°[. 

Dire que y est la limite à droite en a de 
ia fonction numérique f définie sur )ü, b[ 
(exemple 4), c’est dire que y est la limite de 
f suivant le filtre F a + formé des intersec- 
tions de ] a, b[ et des voisinages de a dans 
R. 

On démontre que, si f et g sont des 
applications de A dans R qui ont des 
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limites y et z suivant le filtre alors y -j- 
z (resp. yz ) est limite de f g (resp. limite 
de fg) suivant le filtre ,‘F. 

Notons encore que, si A est un espace 
topologique, les voisinages d’un point a 
forment un filtre sur A ; dire que l’appli- 
cationfde A dans l’espace topologique X 
est continue en a , c’est dire que f a pour 
limite f(u) suivant ce filtre. 

Séparation 

Une suite numérique ne peut avoir deux 
limites ; de même, une fonction numérique 
ne peut avoir deux limites en + oc (ou 
en a). Mais, si l’ensemble A est muni du 
filtre 3 et si / est une application de A dans 
un espace topologique X, deux points 
distincts de X peuvent être limites de / 
suivant le filtre ; par exemple, si X est 
muni de la topologie grossière, tout point 
de X est limite defsuivant le filtre -T. Pour 
avoir l’unicité des limites pour les appli- 
cations à valeurs dans X, on doit supposer 
que X vérifie la condition suivante : Deux 
points distincts de X possèdent des voisi- 
nages disjoints. On dit alors que X est 
séparé . Tous les espaces métriques sont 
séparés, à cause de la relation d(x, y) — 0 
=> x = y ; c’est le fait que R est séparé qui 
permet de faire les raisonnements classi- 
ques dits « par passage à la limite » ou « par 
continuité ». 

3. Espaces compacts 

Les intervalles fermés bornés de R ont des 
propriétés topologiques remarquables, 
connues depuis très longtemps ; ces pro- 
priétés découlent toutes du fait qu’ils 
vérifient la condition suivante, appelée 
condition de Borel-Lebesgue (cf. le théo- 
rème (7) du chapitre 4 de l’article CALCUL 
INFINITÉSIMAL - Calcul à une variable). 


Condition (BL). On dit que l’espace 
topologique E vérifie la condition de Borel- 
Lebesgue si, quelle que soit la famille 
d’ouverts (U,), i E I, de E telle que : 

U u ' ■ E - 

iE I 

il existe un sous-ensemble fini J de I tel 
que : 

|J U, = E. 
iE J 

Par définition, on dit qu’un espace 
topologique est compact s’il est séparé et 
s’il vérifie la condition de Borel-Lebesgue. 
Cette condition est équivalente à chacune 
des deux suivantes. 

Condition (BLf . Quelle que soit la 
famille (F,), i E I, de fermés de E dé inter- 
section vide , il existe un sous-ensemble fini 
J de 1 tel que l’intersection des F„ pour 
i E J, soit vide. 

Condition (BL)" . Quelle que soit la 
famille (F,), i E I, de fermés de E, si, pour 
tout sous-ensemble fini J de 1, 

f> 

iE J 

est non vide, il existe (au moins) un point 
de E qui appartient à tous les F,. 

Exemples 

L’intervalle [a, b] de R est compact. Plus 
généralement, un sous-espace A de R est 
compact si et seulement s’il est fermé et 
borné. De la même façon, les sous-espaces 
compacts de R" sont les fermés bornés. 
Tout sous-espace fermé d’un compact est 
compact. Tout produit d’espaces compacts 
est compact. 

Propriétés 

Citons les plus importantes propriétés des 
espaces compacts. 
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1. Si X est compact et Y séparé, l’image 
d’une application continue de X dans Y est 
un sous-espace compact de Y. En particu- 
lier, si A est compact, l’image d’une 
application continuefde A dans R est un 
sous-espace compact de R ; c’est donc un 
sous-ensemble fermé borné de R ; c’est 
pourquoi / est une application bornée et 
atteint ses bornes. 

2. Propriété de Bolzano - Weier strass. Soit 
(u n ), n E N, une suite de points du com- 
pact A. Alors, il existe un point a de A tel 
que tout voisinage de a contienne u n pour 
une infinité de valeurs de n ; un tel point 
U est appelé une valeur d’adhérence de la 
suite. 

La démonstration, par l’absurde, est la 
suivante : Si, pour tout point x de A, il 
existait un voisinage ouvert V v de x qui ne 
contienne qu’un nombre fini des u tv alors, 
comme N est infini, l’ensemble A ne 
pourrait pas être recouvert par un nombre 
fini des V,. 

Réciproquement, cette propriété de 
Bolzano-Weierstrass entraîne la propriété 
de Borel-Lebesgue si l’espace considéré est 
un espace métrique. 

3. Tout espace métrique compact est 
complet (cf. espaces métriques, chap. 3). 

4. Tout sous-espace compact d’un 
espace topologique E est un fermé de E. 

5. Toute fonction continue d’un espace 
compact dans un espace métrique est 
uniformément continue (cf. espaces MÉTRI- 
QUES, chap. 2). 

Espaces localement compacts 

On dit qu’un espace topologique est loca- 
lement compact s’il est séparé et si chacun 
de ses points possède un voisinage com- 
pact. On se convainc de l’importance des 
espaces localement compacts en remar- 
quant que tous les espaces de la géométrie 
(R, R", surfaces, courbes, variétés diffé- 


rentiables...) sont localement compacts. 
Tout espace localement compact est 
homéomorphe à un ouvert d’un espace 
compact. En fait, on peut même s’arranger 
pour que cet ouvert soit le complémentaire 
d’un unique point de l’espace compact 
(compactification d’Alexandrof). 

Parmi les propriétés les plus utiles des 
espaces localement compacts, citons les 
deux suivantes, qui concernent les problè- 
mes de prolongement de fonctions conti- 
nues lorsque E est un espace localement 
compact « dénombrable à l’infini », c’est- 
à-dire tel qu’il existe une famille dénom- 
brable (K„), E N, de sous-espaces com- 
pacts de E, avec : 

K„ = E. 

1. Théorème de Tietze. Toute fonction 
continue d’un fermé de E dans R est la 
restriction d’une fonction continue définie 
sur E tout entier. 

2. Existence de «partitions de l’unité ». 
Pour tout recouvrement de E par des 
ouverts (U,), i E I, il existe une famille de 
fonctions (/,), i E I, telle que : 

a) quel que soit le point x n’appartenant 
pas à U„ on a f(x) = 0, 

b) en chaque point x, il n’existe qu’un 
nombre fini des f qui ne s’annulent pas, 

£•) pour tout point x, on a : 

//(*) = 1 ^ 

une telle famille de fonctions est appelée 
une partition de l’unité relative au recou- 
vrement' {C)])' /’ E T i, donne. 


4. Espaces connexes 

On regardant une figure géométrique, cha- 
cun sait dire si elle est formée de plusieurs 
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morceaux disioints. La Connexité est la 
notion mathématique qui correspond à 
cette réalité physique. Si la figure F est 
formée de deux morceaux disjoints A et B, 
tout point de F assez voisin de A est encore 
dans A, et tout point de B assez voisin de 
B est encore dans B. Donc A et B sont des 
ouverts non vides et disjoints de F. Inver- 
sement, si F est d’un seul tenant, il n’existe 
pas de partition de F en deux ouverts non 
vides disjoints. Mathématiquement, on 
exprime ce fait en disant que F est 
connexe. 

Les sous-espaces connexes de R sont les 
intervalles de R, ouverts, semi-ouverts ou 
fermés, bornés ou non. Si X est connexe et 
si f : X — ► Y est une application continue, 
l’image de f est un sous-espace connexe de 
Y. En particulier, l’image d’une applica- 
tion continue f : [a, b] —> R est un inter- 
valle de R. C’est le théorème de la valeur 
intermédiaire, qui s’énonce comme suit. 

Théorème. Si f est une application 
continue de [a, b] dans R, quel que soit z 
compris entre f(a) et f(h), il existe un 
point c de ]a , b[ tel que f(c) = Z (cf. 
CALCUL INFINITÉSIMAL - Calcul à Une Varia- 
ble, chap. 9, théorème 14 bis). 

Notons encore que, si X est connexe, 
toute fonction localement constante de X 
dans Y, c’est-à-dire telle que tout point x de 
X possède un voisinage sur lequel f est 
constante, est constante dans X tout entier. 
Le principe des zéros isolés pour les 
fonctions analytiques (cf. FONCTIONS 
ANALYTIQUES -Fonctions analytiques d’une 
variable complexe, chap. 1) utilise ce type 
d’ argumentation. 

CLAUDE MORLET 
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TOPOLOGIQUE algèbre 


L ? algèbre topologique est consacrée à 
l’étude d’ensembles munis d’une 
topologie et d’une structure algébrique 
définie par des lois de composition conti- 
nues (cf. TOPOLOGIE générale ; Algèbre). 
Les exemples les plus importants sont les 
groupes topologiques, les espaces topolo- 
giques à groupe d’opérateurs, les espaces 
vectoriels topologiques (cf. espaces vecto- 
riels TOPOLOGIQUES) et les anneaux topo- 
logiques dont les corps topologiques sont 
un cas particulier. 


1 . Groupes topologiques 

Un groupe topologique est un espace 
topologique G muni d’une loi de compo- 
sition interne continue : G X G — ► G véri- 
fiant les axiomes d’une loi de groupe, notée 
multiplicativement et telle que l’applica- 
tion ,Y l— * A -1 de G dans lui-même soit aussi 
continue (c’est alors un homéomorphisme 
involutif de G sur G). Un morphisme de 
groupes topologiques est une application 
continue qui est un homomorphisme de 
groupes. 

Soit G un groupe topologique ; si 
a £ G, la translation à gauche : 

y a :s^as, s G G, 
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est un homéomorphisme de G sur lui- 
même qui transforme l’élément neutre e en 
a (l’homéomorphisme réciproque est 
Ainsi les voisinages de a sont les 
images y,(V) = üM par y, des voisinages Y 
de e (on pourrait aussi utiliser les transla- 
tions à droite). Par suite, la loi de groupe 
de G étant supposée connue, sa topologie 
est déterminée par le filtre 77 des voisina- 
ges de e ; ce filtre a les propriétés suivan- 
tes : 

(GV,) Quel que soit U E 7/^ il existe V 
G 77 tel que W C U ; cette condition 
exprime que la loi de G est continue en 

(e, e). 

(GV,) Quel que soit U E % on a 
U “ 1 (E 4 Y; cette condition exprime que 
x 1 — ► x 1 est continue en e. 

(GV,) Quels que soient U (E 7/ et 
a G G, on a aXJa ~ 1 (E 7/\ autrement 
dit, l’automorphisme intérieur x ÜXÜ 1 
est un homéomorphisme de G sur G. 

Notons que la condition (GV,) est 
automatiquement vérifiée si G est commu- 
tatif. Inversement, considérons un groupe 
G et un filtre 77 SUf G possédant les 
propriétés précédentes ; il existe sur G une 
topologie et une seule faisant de G un 
groupe topologique et pour laquelle 3^ést 
le filtre des voisinages de e. 

Tout homomorphisme d’un groupe 
topologique dans un autre qui est continu 
en l’élément neutre est continu partout ; 
donc c’est un morphisme de groupes 
topologiques. 

Exemples 

1. On fait d’un groupe quelconque G un 
groupe topologique en le munissant de la 
topologie discrète. 

2. La droite numérique réelle R, munie 
de la loi additive, est un groupe topologi- 
que. Il en est de même du groupe multi- 
plicatif R* = R ™ {0} et de son $0US- 


groupe R* formé des nombres réels 
strictement positifs. L’application expo- 
nentielle x e x , avec x £= R, est un 
isomorphisme de groupes topologiques de 
R sur R* ; l’isomorphisme réciproque est 
donné par le logarithme (cf. EXPONEN- 

TIELLE ET LOGARITHME) . 

3. Plus généralement, on peut considé- 
rer les espaces numériques R'” avec la loi 
additive (et en particulier C w = R 2 " 7 ). Le 
groupe multiplicatif se généralise en le 
groupe GL (m, R) des matrices carrées 
inversibles d’ordre m ; c’est un ouvert de 
M„,(R) = Rm 2 et on le munit de la 
topologie induite. De même GL (m, C) a 
une structure de groupe topologique ; pour 
m — 1, c’est le groupe multiplicatif C* (cf. 
nombres complexes) . 

4. D’une manière encore plus générale, 
tous les groupes de Lie sont des groupes 
topologiques ; rappelons que tout homéo- 
morphisme continu d’un groupe de Lie 
dans un autre est automatiquement analy- 
tique, de sorte que, si un groupe topolo- 
gique admet une structure analytique, 
celle-ci est unique (cf. GROUPES - Groupes 
de Lie). 

5. Soit E un espace vectoriel normé, 
réel ou complexe (cf. espaces vectoriels 
normés) ; sa topologie et sa loi additive en 
font un groupe topologique. Plus généra- 
lement, on peut prendre pour E un espace 
vectoriel topologique (cf. espaces vecto- 
riels TOPOLOGIQUES). Le groupe multipli- 
catif des éléments inversibles d’une algèbre 
de Banach est un groupe topologique (cf. 
algèbres normées) . 

6. Considérons un groupe G et un 
ensemble 2/ de sous-groupes distingués de 
G qui est filtrant pour la relation D ; le filtre 
engendré par 2/définit sur G une topologie 
qui en fait un groupe topologique. Par 
exemple, on peut prendre pour 2/ l’ensem- 
ble des sous-groupes d’indice fini de G. 
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Un cas particulier important est celui 
où l’on se donne une filtration de G par des 
sous-groupes distingués, c’est-a-dire une 
suite décroissante (G w ), avec fl E Z, de 
sous-groupes distingués. Par exemple, la 
topologie p-adique sur le groupe additif Q 
est définie par la filtration (jf Z) oùp est un 
nombre premier (cf. théorie des nombres 
■ Nombres />adique$). 

7. Pour qu’un groupe topologique G 
soit séparé , il faut et il suffit que l’inter- 
section des voisinages de l’élément neutre 
e soit réduite à {*>}, ou encore que {e} soit 
fermé. 

8. Soit G et H des groupes topologi- 
ques ; le produit G X H muni de la 
topologie produit et de la loi de groupe 
produit est un groupe topologique. On 
peut de même considérer le produit d’une 
famille quelconque de groupes topologi- 
ques. Par exemple, R w est le produit de rn 
facteurs identiques à R. Le groupe multi- 
plicatif C* est isomorphe au produit RJ 
X U, où U désigne le groupe multiplicatif 
de nombres complexes de module 1 (muni 
de la topologie induite par C). 

Sous- groupes, groupes quotients 

Soit G un groupe topologique et H un 
sous-groupe de G ; la topologie induite sur 
H par celle de G en fait un groupe 
topologique. Par exemple, les groupes 
classiques, qui sont des sous-groupes de 
GL (fl7, R) ou de GL(m, C), ont une 
structure de groupe topologique : ce sont 
des groupes de Lie (cf. groupes ■ Groupes 
classiques et géométrie). L’adhérence H 
d’un sous-groupe H de G est encore un 
sous-groupej si H est distingué, il en est de 
même de H. Pour qu’un sous-groupe soit 
ouvert, il faut et il suffit qu’il ait au moins 
un point intérieur, et alors il est aussi 
fermé ; ainsi, lorsque la topologie de G est 
définie par un ensemble filtrant de SOUS- 


groupes distingués (cf. exemple 6), ces 
sous-groupes sont à la fois ouverts et 
fermés et G est totalement discontinu. La 
composante connexe de l’élément neutre e 
dans un groupe topologique G est toujours 
un sous-groupe distingué fermé G 0 ; c’est 
le sous-groupe engendré par un voisinage 
arbitraire de e. 

Les sous-groupes fermés de R distincts 
de R sont de la forme flZ, avec a E R ; ils 
sont discrets (les autres sous-groupes sont 
partout denses). Plus généralement, les 
sous-groupes fermés de R m sont de la 
forme : 

vx W = R J X Zt, 

où Y est un sous-espace vectoriel, isomor- 
phe à R\ de R'”, et W - Z ! est un 
sous-groupe engendré par une partie d’une 
base d’un supplémentaire de V ; un tel 
sous-groupe est de rangs t et est discret 
dans le cas où s = 0. On appelle réseau de 
R” un sous-groupe discret de rang maxi- 
mum, c’est-à-dire engendré par une base 
de R w ? donc isomorphe à Z m . 

Parmi les groupes topologiques locale- 
ment compacts, les groupes de Lie (cf. 
exemple 4) sont caractérisés par la 
propriété d’admettre un voisinage de 
l’élément neutre e ne contenant pas 
d’autre sous-groupe que {e} (A. Gleason 
et H. Yamabe, 1953). On en déduit 
qu’un groupe localement compact et loca- 
lement connexe qui est de dimension 
topologique finie est un groupe de Lie ; il 
en est ainsi, en particulier, des groupes 
topologiques qui sont des variétés topolo- 
giques, localement isomorphes à des 
ouverts de R'” ; cela fournit une réponse 
(partielle) au cinquième problème de 
Hilbert. À l’opposé, tout voisinage de e 
dans un groupe localement compact 
totalement discontinu contient un SOUS- 
groupe ouvert ; on en déduit que la 
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topologie d’un groupe compact totalement 
discontinu est définie par un ensemble 
filtrant de sous-groupes distingués (cf. 
exemple 6). 

Soit H un sous-groupe distingué d’un 
groupe topologique G, La topologie et la 
loi de groupe quotient font de G/ H un 
groupe topologique, qui est séparé dans le 
cas où H est fermé et qui est discret dans 
le cas où H est ouvert. Par exemple, si G 
est un groupe compact totalement discon- 
tinu, son quotient G/H par un sous-groupe 
distingué ouvert est discret et compact, 
donc fini. Le tore à une dimension T = 
R/Z est un exemple important de groupe 
quotient ; il est compact, car il est séparé 
(Z étant fermé dans R) et image de 
l’intervalle compact [0, 1], Les groupes 
quotients séparés de R w sont de la forme 
T' X R w - \ où r = s + t est le rang du 
noyau ; un tel groupe est compact seule- 
ment si r — m. Le quotient tTq(G) = G/ 
Gq d’un groupe topologique G par la 
composante connexe G 0 de son élément 
neutre est un groupe topologique séparé et 
totalement discontinu, discret si G est 
localement connexe. 

Tout morphismef: G — ► H de groupes 
topologiques admet une décomposition 
canonique : 

G -G/Ker/-/(G)^H, 

où Kerfest le sous -groupe distinguéf ‘(e) 
de G ; le morphisme fest bijectif, mais ce 
n’est pas un homéomorphisme en général, 
On dit que f est un morphisme strict si 
f est un homéomorphisme ; cela a lieu 
en particulier si G/Ker / est compact 
(resp. localement compact dénombrable à 
l’infini) et /(G) séparé (resp. de Baire). Par 
exemple, le morphisme : 

X Y e 2mx f X G R, 


de R dans C* est un morphisme strict : 

R — ► T = U C*. 

Umites projectives 
de groupes topologiques 

Soit 1 un ensemble ordonné filtrant supé- 
rieurement (c’est-à-dire tel que toute paire 
d’éléments ait une borne supérieure). Un 
système projectif ’ indexé par I, de groupes 
topologiques est un système (G„ ffi où les 
G ,, pour / El, sont des groupes topolo- 
giques et où /y, pour /, y (E 1 avec i ^ j, est 
un morphisme de Gy vv dans G ( . Par défi- 
nition, la limite projective : 

G = Jim G, 

de ce système est le sous-groupe du groupe 
produit 7 tG, formé des éléments x = (*,•) 
tels que ffxf) = x : pour tout i ^ y et G a 
donc une structure de groupe topologique. 
Lorsque les morphismes canoniques G — ► 
G, identifient les G, à des quotients séparés 
de G, on dit quelquefois que les G, donnent 
une approximation de G. 

Considérons un groupe topologique G 
et une famille (H,) de sous-groupes distin- 
gués fermés, filtrante pour la relation D. 
Les morphismes canoniques G — ► G/H, 
définissent un morphisme : 

f: G^G' = JùnG/H,; 

si tout voisinage de e dans G contient l’un 
des H,-, on démontre que / est un mor- 
phisme strict dont le noyau est {£} et dont 
Timage est dense dans G’. En particulier, 
si G est compact, / est un isomorphisme de 
G sur G’ ; un groupe compact totalement 
discontinu G est isomorphe à la limite 
projective des groupes finis G/H, où H est 
un sous-groupe distingué ouvert : on dit 
que G est un groupe profini pour exprimer 
cette propriété d’approximation par des 
groupes finis. Par exemple, le groupe de 
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Galois d’une extension galoisienne infinie 
d’un corps commutatif est un groupe 
profini. 

Tout groupe localement compact 
contient un sous-groupe ouvert approcha- 
ble par des groupes de Lie. 

Structures uniformes, groupes complets 
Soit G un groupe topologique ; à tout 
voisinage V de l’élément neutre on associe 
l’ensemble V (resp. l’ensemble V^) des 
couples (x, y) E G X G tels que x~ 1 y 
(resp. yx~ *) appartienne à V. Lorsque V 
parcourt le filtre des voisinages de e , les V ç 
(resp. les V^) forment le filtre des entou- 
rages d’une structure uniforme compatible 
avec la topologie de G et dite structure 
uniforme gauche (resp. droite) ; en général 
les structures uniformes gauche et droite 
sont distinctes, bien qu’isomorphes par la 
symétrie x l . Cependant, elles coïn- 

cident si G est commutatif ou compact. Si 
G est séparé et si e a un système fonda- 
mental dénombrable de voisinages, on peut 
construire une distance d sur G qui définit 
sa structure uniforme gauche (resp. droite) 
et est invariante à gauche (resp. à droite), 
c’est-à-dire telle que : 

d ( gs , gt) = d (s, t ), 

pour g, 5, t E G ; ainsi G est métrisable (cf. 
espaces métriques). 

On dit que G est complet si l’une ou 
l’autre des structures uniformes gauche et 
droite en fait un espace complet (c’est-à- 
dire où tout filtre de Cauchy converge). 
Par exemple, les groupes localement com- 
pacts sont toujours complets. Soit G le 
complété d’un groupe topologique pour sa 
structure uniforme gauche ; la loi de G se 
prolonge continûment en une loi de 
monoïde sur G, mais la symétrie x ^ X “ 1 , 
pour x E G, ne se prolonge pas en général, 
et G n’est pas un groupe. Si G est 


commutatif, son complété G est un groupe 
topologique ; il en est de même si la 
topologie de G est définie par une famille 
filtrante (H,) de sous-groupes distingués 
tels que les quotients G/H, soient complets. 
Alors le morphisme : 

G ^ G' = Jim G/H f 

se prolonge en un isomorphisme de G sur 
G’. Par exemple, la limite projective Z des 
quotients finis Z//77Z de Z est le complété 
de Z pour la topologie des sous-groupes 
d’indice fini (cf. exemple 6) ; c’est le 
groupe de Galois de la clôture algébrique 
d’un corps fini, engendré topologiquement 
par l’élément de Frobenius a ► a q où q est 
le cardinal du corps de base. Le complété 
de Z pour la topologiep-adique (cf. théorie 
des nombres - Nombre p-adiques) est : 

Z p = Jim Z/p n Z. 

La théorie des familles sommables et 
des séries peut se développer dans un 
groupe topologique complet commutatif 
noté additivement comme dans R (cf. 
SÉRIES ET PRODUITS INFINIS). 

Voici un résultat technique utile en 
algèbre commutative. On associe à tout 
groupe G filtré par des sous-groupes dis- 
tingués G„ (cf. exemple 6) la famille des 
groupes quotients (G„/G„ + i), pour n E Z ; 
on obtient ainsi un « groupe gradué », que 
l’on note gr G. Si u : G — ► H est un 
homomorphisme de groupes filtrés tel que 
u(G n ) C H,„ pour tout n , on désigne par 
gr n u Y homomorphisme de GJG n +\ dans 
H„/H, 1+l déduit de u par passage au 
quotient, d’où le morphisme de groupes 
gradués gr u : gr G — ► gr H. On munit G 
et H des topologies définies par leurs 
filtrations et on suppose que G est réunion 
des G„ et H réunion des H fl . Alors : 

a) si G est séparé et si gr u est injectif. 

U est injectif; 
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b) si G est complet et H séparé, et si gr 
U est surjectif, u est surjectif (si H est 
discret, l’hypothèse que G est complet est 
inutile) ; 

c) si G est complet et H séparé, et si gr 
U est bijectif, u est bijectif. 


2. Espaces à groupe d'opérateurs 

Soit G un groupe topologique et E un 
espace topologique. Une loi d’opération 
de G à gauche sur E est une application 
continue de G X E dans E qui vérifie les 
axiomes suivants, où g.x désigne l’image de 
(g, x) dans E : 

1. Associativité : quels que soient g, h G 
G et x G E, on a g.(h.x) = ( gh).x . 

2. Quel que soit x G E, on a e.X = x, 
où e désigne l’élément neutre de G. 

On définirait de même les lois de 
composition a droite. 

Pour tout x G E, l’application orbitale 
cp x : g l ~* g.x de G dans E, avec g G G, a 
pour image Y orbite G.x de x, et l’image 
réciproque de x par cp Y est un sous-groupe 
G v de G appelé le stabilisateur de X. Deux 
orbites distinctes dans E sont disjointes ; 
ainsi les orbites sont les classes pour une 
relation d’équivalence sur E, et l’on dési- 
gne l’espace topologique quotient par E/G 
(ou par G/E si on veut rappeler que G 
opère à gauche). 

Soit H un sous-groupe d’un groupe 
topologique G ; il opère à droite sur G par 
la loi (y h) ► sh, pour s G G et h G H. 
L’orbite ,vH de s est aussi appeiée sa classe 
à droite suivant H ; le groupe G opère à 
gauche sur le quotient G/ H par la loi 
(g, sH) * ► gsH , pour g, s G G, et cela de 
façon transitive (il y a une seule orbite). 
Lorsque G est métrisable complet, on 
démontre que G/ H est encore métrisable 


complet pour tout sous-groupe fermé H 
de G. 

On dit que G opère proprement sur E si 
l’application (s, x) l — > (x, s.x) de G X E 
dans E X E est propre. Alors, les appli- 
cations orbitales sont propres, les orbites 
sont fermées et les stabilisateurs sont 
compacts ; enfin, pour tout x G E, l’appli- 
cation orbitale définit un isomorphisme de 
G/G v sur G.X (en particulier si G opère 
proprement et transitivement dans E, 
l’espace E est isomorphe à G/G v pour tout 
X G E). Lorsque G est localement compact 
et E séparé, pour que G opère proprement 
il faut et il suffit que la condition suivante 
soit satisfaite : Quels que soient les points 
X et y de E, il existe des voisinages V et W 
de x et de y respectivement tels que 
l’ensemble des GG pour lesquels on a s. Y 
nw^0 soit un ensemble relativement 
compact , donc fini dans le cas particulier 
où G est discret. Dans ce cas, si E est 
localement compact, on a encore le critère 
suivant pour une loi d’opération propre : 
Pour toute partie compacte K de E, 
l’ensemble des s G G pour lesquels on a s. K 
fl K ^ 0 est un ensemble fini. 


3. Anneaux topologiques 

On appelle anneau topologique un groupe 
topologique A commutatif, noté additive- 
ment, muni d’une loi multiplicative conti- 
nue A X A — ► A qui en fait un anneau (cf. 
anneaux et algÈbres) . Un morphisme 
d’annçaux topologiques est une applica- 
tion continue qui est un homomorphisme 
d’anneaux. 

Exemples 

1. Les anneaux discrets sont des anneaux 
topologiques. 
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2. Les corps R et C des nombres réels 
et complexes, les anneaux M,,(R) et 
M,,(C) des matrices carrées d’ordre m à 
coefficients réels ou complexes, les algè- 
bres normées, réelles ou complexes, sont 
des anneaux topologiques. 

3. Les corps p-adiques et l’anneau 
des adèles A (cf. théorie des nombres 
- Nombres algébriques) sont des anneaux 
topologiques. 

4. On peut faire d’un anneau A un 
anneau topologique, un « anneau linéaire- 
ment topologisé », au moyen de la topo- 
logie définie par une famille filtrante 
décroissante d’idéaux bilatères (cf. chap. 1, 
exemple 6). 

On peut encore associer une topologie 
compatible avec la structure d’anneau à 
toute filtration (A„), avec n G Z, suite 
décroissante de sous-groupes du groupe 
additif de A telle que A in A w C A„+„ pour 
m, n G Z et 1 G A,. Par exemple, si m 
est un idéal bilatère de A, il définit 
une filtration dite m-adique, pour laquelle 
A„ = m" si n ^ 0 et A, = A si n < 0 ; 
on en déduit la topologie m-adique sur A. 
Pour A = Z et m= pZ, où p est nombre 
premier, on retrouve la topologie 
p-adique ; comme autre exemple, signalons 
le cas où A ~ K[Xj, X 2 , XJ est un 
anneau de polynômes à coefficients dans 
un anneau commutatif K et où m = (X„ 

X 2 ,....x r ). 

Soit A un anneau topologique ; sa loi 
multiplicative se prolonge continû- 
ment en A X A — ► A et le complété A 
est encore un anneau topologique. Par 
exemple, le complété Z /; de Z pour la 
topologie p-adique est un anneau topolo- 
gique ; on peut en dire autant du 
complété : 

K[[X h X 2 , . XJ] 

= J]mK[X lf x XH/m* 

n 


de K [X], X 2 , . . . . X,] pour la topologie 
m-adique, où m = (X,. X 2 , .... XJ. Cet 
anneau filtré complet n’est autre que 
l’anneau des séries formelles en les X, à 
coefficients dans K. Soit A un anneau 
commutatif et m un idéal maximal de A ; 
le complété de A pour la topologie 
m-adique est un anneau local d’idéal maxi- 
mal m (c’est le cas de Z, p et de l’anneau des 
séries formelles si K est un corps). 

Soit A un anneau commutatif complet 
pour une topologie définie par une famille 
filtrante d’idéaux a ; le complété de 
l’anneau de polynômes A[Xj, Xi, .... X,.] 
pour la topologie définie par les idéaux 
a[Xj, X 2 , .... X,] s’identifie au sous-anneau 

de A[[X„ X 2 XJ] formé des séries 

formelles dont les coefficients tendent vers 
0 dans A ; cet anneau est appelé l’anneau 
des séries formelles restreintes. Le lemme 
de Hensel (cf. théorie des nombres - Nom- 
bres padiques, chap. 2) a une formulation 
générale dans ce cadre. 

Soit A un anneau commutatif et m un 
idéal de A ; pour tout A-module M, la 
filtration m-adique (nf M), avec fl G N, 
fait de M un groupe topologique additif tel 
que la loi externe A X M — * M soit 
continue (« module topologique »). Le 
théorème de Krull affirme que, dans le cas 
où A est noethérien et M de type fini, la 
topologie induite par celle de M sur un 
sous-module quelconque N est identique 
à la topologie m-adique de N, définie par 
la filtration (m" N). Si m est contenu 
dans le radical de A (intersection des 
idéaux maximaux), tout A-module de type 
fini est séparé pour la topologie m-adique 
et le complété M d’un tel module M 
s’identifie à A M ; les suites exactes de 
modules de type fini le restent après 
complétion ; autrement dit, A est plat 
sur A. 
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4. Corps topologiques 

On appelle corps topologique un anneau 
topologique K qui est un corps et dans 
lequel l’application x l_H * X pour x E K 
et x ^ 0, est continue. Les plus importants 
des corps topologiques sont les corps 
valués, dont la structure est définie par une 
valeur absolue, c’est-à-dire une application 
x i — ► x de K dans R + vérifiant : 

(VAj) | jc | = 0 <^x = 0, 

(VA,) \xy\ = \x\.\y\, 

(VA 3 ) \x + y\ < 1*1 + \y\, 

quels que soient x, y E K. Une valeur 
absolue définit une distance d(x , y) = 
y x |, donc une topologie. On dit que la 
valeur absolue est ultramé trique si elle 
vérifie la condition suivante, plus forte que 

(VA,) : 

|* + .V| < sup(|*|> M). 

quels que soient A', y E K ; dans ce cas, 
l’application v : X ^ log 1/ x de K* = 
K {0} dans R est une valuation , 
c’est-à-dire vérifie, pour x, y E K*, les deux 
condiïidxnas : 

(VL,) v(xy) = v(x) + v0>), 

(VL 2 ) v(x+y) > inf (v(x), v(y)). 

Inversement, toute valuation définit 
une valeur absolue par la formule 
.V ~ où a est un nombre réel choisi 
dans l’intervalle ]0, 1[. 

Exemples 

1. Sur le corps Q des nombres rationnels, 
les valeurs absolues sont de l’un des trois 
types suivants : 

u) la valeur absolue impropre, qui vaut 
0 en 0 et 1 ailleurs ; 

b) les valeurs absolues p-adiques : 


où l’on a 0 < ci < 1 et où \) p est la 
valuation p-adique (cf. théorie des nom- 
bres - Nombres p-adiques) ; 

c) les applications x ^ X \ où .V est la 
valeur absolue usuelle et où l’on a 
0 <5^1. Ces valeurs absolues définis- 
sent la même topologie que la valeur 
absolue usuelle. 

2. Les corps topologiques localement 
compacts sont des corps valués (cf. théorie 
des nombres - Nombres algébriques). 

3. Si K est un corps valué non ultra- 
métrique, il existe un isomorphismej de K 
sur un sous-corps partout dense de l’un des 
corps R, C ou le corps H des quaternions 
et un nombre réel s E ]0, 1] tels que 
x = j (x) | y , pour x K (théorème 

d’Ostrowski). 

Le complété d’un corps topologique K 
est un anneau qui n’est pas un corps en 
général ; cependant c’est un corps dans le 
cas où K est valué. 
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TOPOLOGIQUES espaces 

VECTORE1S 


L a théorie des espaces normés, déve- 
loppée par S. Banach et ses élèves, s’est 
vite révélée insuffisante pour les besoins de 
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l’analyse fonctionnelle où interviennent de 
nombreux espaces vectoriels munis d’une 
topologie qui n’est pas déduite d’une 
norme. Les espaces vectoriels topologi- 
ques et leurs variantes définis dans cet 
article sont des généralisations des espaces 
normés ; la convexité y joue un rôle 
essentiel. 

* 


1. Définition et exemples 

Soit K un corps valué complet non discret, 
par exemple R ou C (cf. algèbre TOPOLO 
gique) . Une topologie sur un K-espace 
vectoriel E est dite vectorielle si les appli- 
cations (x, }’) X + y et (A, x) ► Ax de 
EXE dans E et de K X E dans E sont 
continues ; on appelle espace vectoriel 
topologique sur K un K-espace vectoriel 
muni d’une topologie vectorielle. Un tel 
espace E est, pour sa loi additive, un 
groupe commutatif topologique, et sa 
topologie est donc déterminée par le filtre 
77 des voisinages de l’élément neutre 0. 
Rappelons que ce filtre vérifie les condi- 
tions suivantes (écrites ici en notation 
additive) : 

(GV,) Quel que soit U E ^ il existe 
VE 77 tel que V + V C U ; 

(GV,) Quel que soit U E 77, on a 

-UE 

En exprimant la continuité de l’appli- 
cation (À, x ) Ax, on trouve les condi- 
tions suivantes, dont la première renforce 
(GV 2 ) : 

(EV,) Quels que soient U E 77 et 
À E K, on a AU E^ 77 \ de plus, on a : 

XU = E. 

xe K 


(EV,) Quel que soit U E 77, il existe 
VE? ‘contenu dans U et équilibré, c’est- 
à-dire tel que : 

Inversement, considérons un K-espace 
vectoriel E et un filtre sur E possédant 
les propriétés (GV,), (EV 2 ) et (EV,) ; il 
existe sur E une topologie vectorielle et une 
seule pour laquelle ^ est le filtre des 
voisinages de 0. 

Un espace vectoriel topologique E a 
une structure uniforme naturelle dont les 
entourages sont les ensembles : 

V = {(x,y)eE X E\y— xGV}, VE W. 

Pour que E soit séparé, il faut et il suffit 
que {0} soit fermé ; si, de plus, le filtre 77 
admet une base dénombrable, il existe une 
distance invariante par translation qui 
définit la structure uniforme de E. Les lois 
interne et externe de E se prolongent par 
continuité au complété Ê et en font un 
espace vectoriel topologique sur K. 

Les espaces vectoriels topologiques que 
l’on rencontre en analyse sont le plus 
souvent localement convexes, c’est-à-dire 
que leurs filtres 77 de voisinages de 0 
vérifient la condition suivante, plus forte 
que (EV,) : 

(EV’,) Quel que soit U E 77, il existe 

V E 77 qui est disqué et contenu dans U. 

Une partie V d’un espace vectoriel E est 

dite disqué e si, pour toute famille finie (A,), 
avec i E I, de scalaires, on a : 

|X,|< 1 => V C V ; 

iEl i E ï 

on dit encore que V est un disque. Si 
K = R (resp. C), les disques de E sont les 
parties convexes (cf. CONVEXITÉ) et symé- 
triques (resp. équilibrées), d’où le terme 
« localement convexe ». Notons que les 
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conditions (EV,) et (EV,) impliquent 
(GV,) car, si V est disqué, on a 
V D AV + AV, avec A E K, choisi tel que 
0 < A ^1/2 (rappelons que K n’est pas 
discret). Le complété d’un espace vectoriel 
topologique localement convexe (en 
abrégé e.l.C.) est encore localement 
convexe ; on appelle espace de Fréchet un 
e.l.c. métrisable et complet. 

Exemples 

1 . Les espaces « numériques » K w , avec la 
topologie produit, sont des e.l.c. complets ; 
on démontre (par récurrence sur m) que la 
seule topologie vectorielle séparée sur K m 
est la topologie produit. 

2. Tout espace vectoriel normé E est un 
e.l.c. ; un système fondamental de voisina- 
ges de 0 dans E est formé des homothé- 
tiques de la houle unité : 

B = [x £ Eli* || ^ il. 

Comme cas particuliers, on trouve 
l’espace e(X) des fonctions numériques 
continues sur un espace topologique com- 
pact X (avec la topologie de la convergence 
uniforme dans X), l’espace l p des suites de 
scalaires de puissance p-ième sommabie et 
l’espace If (X, p) des classes de fonctions 
de puissance p-ième intégrable dans un 
espace mesuré (X, p), avec p ^ 1 et 
K = C ; ces espaces sont complets, c’est- 
a-dire que ce sont des espaces de Banach. 
Lorsque 0 < p < 1, on peut encore défi- 
nir un espace vectoriel topologique 
L”(X, p), qui est métrisable et complet, 
mais non localement convexe. 

3. Si X est un espace topologique 
séparé, on fait un e.l.c. de l’espace e(X) des 
fonctions numériques continues dans X en 
le munissant de la topologie de la conver- 
gence uniforme sur tout compact de X ; un 
système fondamental de voisinages de 0 


pour cette topologie est formé des ensem- 
bles : 

v Cl = {/G e(X)j||/|| c = supj/(x)| ^ e), 

où C est un compact quelconque de X et 
où e EE RT. Cet espace est complet si X est 
localement compact ou métrisable ; il est 
métrisable s’il existe une suite (C,) de 
compacts de X telle que tout compact de 
X soit contenu dans l’un des C„. 

En utilisant les ensembles finis F C X 
au lieu des compacts C, on définit d’une 
manière analogue la topologie de la 
convergence simple qui est aussi vecto- 
rielle et localement convexe, mais non 
complète sur e(X) si X est infini. 

4. Soit X une variété différentiable, de 
classe m ^ — f- oo, par exemple un ouvert de 
R". Sur l’espace £"(X) des fonctions numé- 
riques de classe m dans X, on définit une 
topologie vectorielle localement convexe 
en prenant comme système fondamental de 
voisinages de 0 la famille des ensembles : 

V A , c , e = {/*E £» (X)|V DGA, |D/|| C < e], 

où A est un ensemble fini d’opérateurs de 
dérivation d’ordre ^ m, où C est un 
compact de X et où l’on a E > 0. L’ei.C. 
£ n (X) ainsi obtenu est complet ; il est 
métrisable si X est dénombrable à l’infini 
(ce qui est le cas pour un ouvert de R”) et 
normable si X est compacte et m fini. On 
écrit 6(X) pour C”(X). 

5. La construction de l’exemple 4 
admet plusieurs variantes ; par exemple, si 
X est un ouvert de R ' 7 et sip ^ 1 , on définit 
un espace de Fréchet 3) L ^(X) dont les 
éléments sont les fonctions indéfiniment 
dérivables dans X dont toutes les dérivées 
sont de puissancep-ième intégrable, avec la 
topologie définie par le système fondamen- 
tal de voisinages de 0 : 

Vi, t = {fe ® Lp (X)| v DE A, IID/II, « e}, 
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où A est un ensemble fini d’opérateurs de 
dérivation et où l’on a £ > 0, la norme dans 
I/(X) étant désignée par || * |,. Citons 
encore l’espace S des fonctions indéfini- 
ment dérivables à décroissance rapide dans 
R", qui est aussi un espace de Fréchet ; ses 
éléments sont les fonctions indéfiniment 
dérivables dont toutes les dérivées décrois- 
sent à l’infini de R 77 plus vite que toute 
puissance de 1 / |[ x ||, une norme étant choi- 
sie dans R" ; un système fondamental de 
voisinages de 0 est donné par : 

VA,*,e= {/’CSIVDCA, 

y”’ +|| JT || J )*D/(*)| 6 e}, 

xdz 1 

où A est un ensemble fini d’opérateurs de 
dérivation, k un entier naturel et £ > 0. 

6. Soit U un ouvert de Q n et (9(U) 
l’espace vectoriel des fonctions holomor- 
phes dans U. La topologie de la conver- 
gence uniforme sur tout compact de U (cf. 
exemple 3) en fait un espace de Fréchet. 

7. Soit S(X, ]d) l’espace vectoriel des 
classes de fonctions p-mesurables sur un 
espace mesuré (X, p) ; on le munit d’une 
topologie vectorielle en prenant comme 
système fondamental de voisinages de 0 la 
famille des ensembles V A ô E : 

(/E S(X, M) p* (A n/-> (C[ — e, e])) < ô], 

où A est une partie p-intégrable de X et où 
Ô et £ sont des nombres réels > 0. La 
topologie ainsi définie est appelée celle de la 
convergence en mesure et elle est importante 
en calcul des probabilités ; elle n’est pas 
localement convexe, mais elle fait de S(X, 
p) un espace vectoriel topologique complet. 

2. Limites projectives 
et limites inductives 

Soit (E,), pour i (= I, une famille d’espaces 
vectoriels topologiques, E un espace vec- 


toriel et, pour chaque /, une application 
linéaire f : E — ► E, ; la moins fine des 
topologies sur E pour lesquelles les f i sont 
continues est vectorielle : on l’appelle la 
topologie initiale pour les fj. Si les E, sont 
tous localement convexes, il en est de 
même de E muni de la topologie initiale. 

Lorsque I = {0} est réduit à un élé- 
ment et que^ : E Eq est l’injection d’un 
sous-espace vectoriel, la topologie initiale 
n’est autre que la topologie induite ; elle est 
séparée (resp. métrisable) si celle de Eq 
l’est. Si Eq est complet et E fermé, E est 
aussi complet ; l’adhérence d’un SOUS- 
espace vectoriel est encore un sous-espace 
vectoriel. 

Sur le produit E = IIE, d’une famille 
(E,), pour / (E I, d’espaces vectoriels tOpO- 
logiques, la topologie initiale pour les 
projections pr,- : E — ► E, est la topologie 
produit. Considérons plus généralement 
un système projectif (E h f f j) d’espaces vec- 
toriels topologiques, avec des morphismes 
de transition f ï} : E,— ► E, linéaires conti- 
nus ; la limite projective E — lim E„ c’est- 

à-dire le sous-espace de IIE, formé des (x,) 
tels que f l} { xj) = A'-, pour tout morphisme 
de transition& est munie de la topologie 
initiale pour les applications f : E — ► E, 
induites par les projections. Lorsque les E, 
sont séparés (resp. complets), il en est de 
même de E ; si les E, sont métrisables et si 
I est dénombrable, E est métrisable. 

À tout disque V d’un espace vectoriel E 
on associe la semi-norme py jauge de V (cf. 
convexité), telle que : 

p v (x) = inf {|X ||x G XV}, a GE, 

et l’espace semi-normé E^^ qui est I e 
sous-espace engendré par V muni de la 
semi-norme /7 V , Supposons E muni d’une 
topologie localement convexe et prenons 
pour Y un voisinage disqué de 0 ; alors, en 
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vertu de la condition (EV,), l’espace Ev est 
E tout entier (on dit que V est absorbant) 
et, lorsque V varie, la topologie de E est 
initiale pour les applications E — ► Ev éga- 
les à l’application identique. On dit que 
cette topologie est définie par la famille 
de semi-normes (/? v ) v » les espaces E et 
lim E v sont alors isomorphes en tant 

qu’espaces topologiques. Lorsque E est 
séparé, on en déduit qu’il est limite pro- 
jective des espaces normés E^, en dési- 
gnant par E^ l’espace séparé associé à Ev ; 
lorsque E est complet et que K est R ou 
C ou un corps « maximalement complet », 
on voit à l’aide du théorème de Hahn- 
Banach (cf. convexité) que E est limite 
projective des espaces de Banach Ê v . 

De façon duale, on peut considérer la 
topologie finale sur un espace vectoriel E 
pour une famille d’applications linéaires^ : 
E/— ► E définies dans des espaces vectoriels 
topologiques E ( : c’est la plus fine des 
topologies vectorielles sur E rendant conti- 
nues les fi ; elle n’est pas en général 
localement convexe, même si tous les E, le 
sont, et, dans ce cas, on considère plutôt la 
topologie localement convexe la plus fine 
rendant les^/J continues, qui est moins fine 
que la précédente. En particulier, on défi- 
nit ainsi l’espace vectoriel topologique 
(resp. l’e.l.C.) limite inductive d’un système 
inductif (E h ffi d’espaces vectoriels topo- 
logiques (resp. cTe.l.C.). 

Soit E, un espace vectoriel topologique 
et E 0 un sous-espace de E, ; sur le quotient 
E = E|/E 0 , la topologie vectorielle finale 
pour l’application canonique E, — ► E est la 
topologie quotient et les voisinages de 0 
dans E sont les images des voisinages de 0 
dans E,. Si E, est localement convexe, il en 
est de même de E ; pour que E soit sépare, 
il faut et il suffit que E 0 soit fermé dans E,. 
Si Ej est métrisable et complet et si Eq est 


fermé, alors E est métrisable et complet 
(cf. algèbre topologique) . Toute applica- 
tion linéaire continue fi : E — ► F d’un 
espace vectoriel topologique dans un autre 
admet une décomposition canonique : 

E — » E/Ker /^-*/(E) F ; 

l’application linéaire f est bijective mais 
n’est pas un homéomorphisme en géné- 
ral : on dit que fi est stricte si / est 
un isomorphisme d’espaces vectoriels 
topologiques. Le théorème d’homomor - 
phisme de Banach s’énonce de la manière 
suivante. 

Théorème. Soit E et F des espaces 
vectoriels topologiques métrisables et com- 
plets et fune application linéaire continue 
de E dans F. Si /(E) n’est pas maigre, par 
exemple si fi est surjective (théorème de 
Baire ; cf. espaces vectoriels normes, 
chap. 4), alors f est un épimorphisme strict, 
identifiant F à un quotient de E. 

Corollaire (Théorème du graphe fermé). 
Soit g : F- E une application linéaire 
d’un espace vectoriel topologique métrisa- 
ble complet dans un autre. Pour que g soit 
continue, il faut et il suffit que, pour toute 
suite (y n ) convergeant vers 0 dans F et telle 
que (g(y n )) converge dans E, on ait lim 

g(}'n) = 0 . 

En effet, la condition signifie que le 
graphe de g est un sous-espace fermé de 
F X E, donc un espace métrisable et 
complet; la projection ► F, qui est 
bijective, est donc un isomorphisme et g 
s’obtient en composant l’isomorphisme 
réciproque avec l’autre projection : 



Il existe diverses généralisations de ces 
résultats, où F est remplacé par un espace 
localement convexe séparé, limite induc- 
tive d’espaces de Banach, et E par un 
espace localement convexe souslinien (L. 
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Schwartz-A. Martineau) ou par un espace 
admettant un « réseau absorbant » (M. De 
Wilde). 


3. Bomologies 

Pour comprendre de façon claire et natu- 
relle la théorie des espaces vectoriels topo- 
logiques, il faut étudier simultanément une 
structure voisine, celle d’espace vectoriel 
bornologique, que les traités classiques 
laissent malheureusement de côté au prix 
d’un certain nombre d’obscurités et de 
maladresses. 

Une homologie sur un ensemble E est 
un ensemble fXde parties de E vérifiant les 
axiomes suivants : 

(B,) Quels que soient A E ^et A’ CA, 
on a A’ E 

(B 2 ) Quels que soient A„ A 2 E ^ on a 
A, UA 2 E .s*; 

(B 2 ) La réunion des A, pour A E ^ est 
égale à E. 

Un ensemble E muni d’une bomologie 
s’appelle un espace homologique et les 
éléments de la bomologie de E s’appellent 
les parties bornées de E ; une application/ : 
E — » F d’un espace bornologique dans un 
autre est dite bornée si elle transforme les 
parties bornées de E en parties bornées de 
F. Le corps K est, comme tout espace 
métrique, muni d’une bomologie naturelle 
dont les éléments sont les parties de 
diamètre fini. Si (E,), pour i E I, est une 
famille d’espaces bornologiques, la bor- 
nologie produit sur E = PE, a pour élé- 
ments les parties dont toutes les projec- 
tions sont bornées ; par exemple, K X K 
est un espace bornologique pour la bor- 
nologie produit et l’addition et la multipli- 
cation de K sont des applications bornées 
de K X K dans K. Une bomologie sur 
un K-espace vectoriel E est dite vectorielle 


si les applications (x:, y) ’ *x -(- y et 
(À, x ) 1 * À x de E X E dans E et de K X E 
dans E sont bornées. Cela équivaut aux 
conditions suivantes : 

(EB,) Quels que soient A„ A^E . 5 ^ on 

a Aj + A 2 .5?; 

(EB 2 ) Quels que soient A E S? et 
À EK, on aÀAE.^; 

(EB 3 ) Quel que soit A E F« enve- 
loppe équilibrée de A », c’est-à-dire la 
réunion des ensembles AA, pour A ^1, 
appartient à , X. 

Un espace vectoriel muni d’une borno- 
logie vectorielle s’appelle un espace vec- 
toriel bornologique. Les plus fréquents des 
espaces vectoriels bornologiques sont de 
type convexe, vérifiant la condition plus 
forte que (EB,) : 

(EB' 3 ) L’enveloppe disquée d’un borné 
est bornée. 

Remarquons que (B ? ), (EB->) et (EB’,) 
impliquent (EB,). 

On dit qu’un espace vectoriel bornolo- 
gique E est séparé si le seul sous-espace 
vectoriel borné de E est (0). 

Exemples 

1. La bomologie produit sur K m est la 
seule bomologie vectorielle séparée ; elle 
est de type convexe. 

2. Tout espace vectoriel normé E a une 
bomologie de type convexe dont les bornés 
sont les parties de diamètre fini, c’est-à-dire 
contenues dans une boule. 

3. Sur un espace vectoriel quelconque 
E, la bomologie vectorielle la plus fine est 
formée des parties contenues dans un 
sous-espace de dimension finie et bornées 
dans ce sous-espace ; elle est de type 
convexe et séparée. 

4. Soit X une variété différentiable de 
classe m ^ -f- 00 ; sur l’espace ‘d)“(X) des 
fonctions numériques m fois différentia- 
bles à support compact dans X, on définit 
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une bornologie vectorielle de type 
convexe, dont les éléments sont les ensem- 
bles de fonctions uniformément bornées, 
ainsi que toutes leurs dérivées d’ordre 
^ m et nulles en dehors d’une même 
compact de X. 

Voici un autre exemple d’espace vec- 
toriel bornologique de type convexe 
(en abrégé e.b.c.) de fonctions différenti- 
ables : l’espace des fonctions indéfiniment 
différentiables à croissance lente dans R". 
Ses éléments sont les fonctions / indéfini- 
ment différentiables dont toutes les déri- 
vées ont au plus une croissance polyno- 
miale à l’infini de R /? ; les bornés sont les 
parties contenues dans l’un des ensem- 
bles : 

B (Pd) = {/; V D, V*,|D/(*)i <|P D (*)|}, 

où (P [} ) est une famille de polynômes 
indexée par l’ensemble des opérateurs de 
dérivation D ; on dit que les B (PD) forment 
un système fondamental de bornés. 

5. Soit U un ouvert de K” et 0(U) 
l’espace des fonctions analytiques dans U, 
c’est-à-dire localement développables en 
série entière convergente dans U. Si V est 
un polydisque de centre a et de rayon r 
contenu dans U et si / est une fonction 
analytique dans U dont le développement 
de Taylor en a est : 

ïc v (z — a) v , 

on pose : 

!/1lv= Ekvkv; 

on définit alors sur 0(U) une bornologie de 
type convexe en prenant comme système 
fondamental de bornés les ensembles : 

B % . / = [fG 0(U) | V,, 11/11 U; < M/}, 

où //= (U,), pour i G I, est un recouvre- 
ment de U des polydisques et où 
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//— (M,), pour /G 1, est une famille de 
constantes. 

On définit sans peine les notions de 
bornologie initiale et de bornologie vecto- 
rielle finale pour une famille d’applications 
linéaires, comme au chapitre 2. On peut 
ainsi parler de sous-espaces et de limites 
projectives bornologiques, ainsi que 
d’espaces quotients et de limites inductives 
bornologiques. Considérons un e.b.c. E ; 
sa bornologie est finale pour les injections 
E A — ► E où A décrit l’ensemble des disques 
bornés de E et où E A est le sous-espace 
engendré par A muni de la semi-norme p A , 
jauge de A. On a un isomorphisme : 

lim E A ^ E 

A 

d’espaces vectoriels bornologiques ; pour 
que E soit séparé, il faut et il suffit que 
chaque E A le soit, c’est-à-dire soit un 
espace normé. Par exemple, la bornologie 
la plus fine sur un espace vectoriel E est 
limite inductive des bomologies séparées 
sur les sous-espaces de dimension finie de 

E. 

On dit qu’un e.b.c. E est complet s’il 
existe un système fondamental de disques 
bornés A tels que E A soit complet ; cela 
revient à dire que E est séparé et limite 
inductive d’espaces de Banach. Tout e.b.c. 
E admet un complété Ê qui est le « séparé 
associé » à : 

A 

lim E a ; 

A 

l’application canonique de E dans Ê n’est 
pas injective en général, même si E est 
séparé : il existe des e.b.c. séparés non nuis 
dont le complété est nul, comme l’a montré 
L. Waelbroeck. Toute limite projective et 
toute limite inductive séparée d’ e.b.c. com- 
plets sont complètes. Les exemples donnés 
sont des e.b.c. complets. 
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On dit qu’une suite (x„) de points d’un 
espace vectoriel bornologique E converge 
vers une limite x au sens de Mackey s’il 
existe une suite bornée (y n ) dans E et une 
suite (À w ) tendant vers 0 dans K telles que 
X n X = À^. Une partie X de E est dite 
fermée (au sens de Mackey) si toute limite 
(au sens de Mackey) de points de X 
appartient à X ; pour qu’un sous-espace F 
de E soit fermé, il faut et il suffit que le 
quotient E/F soit séparé. Pour que E soit 
séparé, il faut et il suffit que toute suite 
convergente dans E ait une seule limite, ou 
encore que la diagonale Â E soit fermée 
dans EXE. Lorsque E est de type 
convexe, la convergence au sens de Mac- 
key dans E est équivalente à la conver- 
gence dans l’un des espaces semi-normés 
E A ou A est un disque borné dans E. 
Dans un e.b.c. complet E, toute suite 
de « Cauchy-Mackey » (x,), telle que 
(x m — x^) tende vers 0 au sens de Mackey 
pour m, n — ► oo, est convergente ; mais 
cette condition n’est pas suffisante pour 
assurer que E est complet. 


4. Espaces d’applications linéaires 
et produits tensoriels 

Soit E et F des espaces vectoriels topolo- 
giques ; on désigne par C(E, F) l’espace 
vectoriel des applications linéaires conti- 
nues de E dans F, muni de la bomologie 
vectorielle dont les éléments sont les 
ensembles équicontinus d’applications 
linéaires : un ensemble H d’applications 
linéaires est équicontinu s’il l’est en 0, 
c’est-à-dire si, pour tout voisinage V de 0 
dans F, il existe un voisinage U de 0 dans 
E tel que : 

H(U) = IJ/(U)CV. 

f€H 


Lorsque E = K, l’application /•— /( 1) 
identifie £(K, F) à F et permet de munir F 
d’une bomologie vectorielle, la bornologie 
canonique ou bornologie de von Neu- 
mann ; ses éléments sont les parties A de 
F qui sont absorbées par chaque voisinage 
V de 0 dans F (il existe X 6= K tel que 
A C AV), et on note l’espace F muni de 
cette bornologie. L’adhérence dans F d’un 
tel borné est encore bornée ; pour que 
ACF soit borné, il faut et il suffit que 
toute partie dénombrable A soit bornée. Si 
U est un ouvert de C", la bornologie 
canonique de l’espace de Fréchet 0(U) des 
fonctions holomorphes dans U (chap. 1, 
exemple 6) n’est autre que celle qu’on a 
définie dans l’exemple 5 du chapitre 3. 

Soit maintenant E et F des espaces 
vectoriels bornologiques ; on fait de 
l’espace £(E, F) des applications linéaires 
bornées de E dans F un espace vectoriel 
bornologique en prenant comme bornés 
les ensembles H équibomés d’applications 
linéaires, tels que, pour tout borné A de E. 
il existe un borné B de F, avec H(A) C B. 
On associe encore un espace vectoriel 
bornologique C(E, F) d’applications linéai- 
res au couple d’un espace vectoriel topo- 
logique E et d’un espace vectoriel borno- 
logique F ; ses éléments sont les 
applications linéaires bornantes (c’est-à- 
dire transformant un certain voisinage de 
0 dans E en un borné de F) et ses bornés 
sont les ensembles H équibornants (pour 
lesquels il existe un voisinage U de 0 dans 
E et un borné B de F tels que H(U) C B). 

Considérons enfin un espace vectoriel 
bornologique E et un espace vectoriel 
topologique F. Sur Horn, (E, F), la topo- 
logie de la convergence uniforme dans les 
bornés de E a comme voisinages de 0 les 
ensembles : 

T(A, V) = (/|/(A) C V), 
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où A est un borné de E et V un voisinage 
de 0 dans F ; ces voisinages engendrent le 
sous-espace L(E, F) des applications linéai- 
res bornées de E dans & F. Sur l’espace 
C(E, F) ainsi défini, on voit que la topolo- 
gie précédente est vectorielle. 

À tout couple (E, F) d’espaces vecto- 
riels munis de structures topologiques ou 
bornologiques nous avons ainsi associé un 
espace d’applications linéaires C(E, F) qui 
est bornologique, sauf dans le cas où E est 
bornologique et F topologique ; dans ce 
dernier cas, £(E, F) est topologique. Fors- 
que F est de type convexe (resp. séparé, 
resp. complet), il en est de même de C(E, 
F). En particulier, si F est un e.l.C., b ¥ est 
de type convexe ; pour que soit séparé, 
il faut et il suffit que F le soit; si F est 
complet, il en est de même de *F, mais la 
réciproque n’est pas vraie en général 
(cependant elle est vraie si F est supposé 
métrisable). F’ espace C(E, F) dépend fonc- 
toriellement de E et de F ; si (E/) est un 
système inductif et (F,) un système projec- 
tif, le morphisme canonique : 

£(lim Ei , lim F/) — ► lim £(E/ , F y) 

est un isomorphisme, à condition que le 
système (E,) soit fini s’il s’agit d’espaces 
vectoriels topologiques et que les deux 
systèmes soient finis si les E, sont topolo- 
giques et les F, bornologiques. Par exem- 
ple, le foncteur F — ► h F commute aux 
limites projectives ; il commute aussi aux 
limites inductives strictes, c’est-à-dire 
dénombrables et dont les morphismes de 
transition sont des monomorphismes 
stricts d’images fermées. 

Considérons maintenant trois espaces 
E, F et G, avec des structures topologiques 
ou bornologiques. On leur associe d’une 
manière analogue un espace $(E, F ; G) 
d’applications bilinéaires de E X F dans 


G, avec une structure bornologique en 
général. Forsque E, F et G sont topologi- 
ques (resp. bornologiques), on prend les 
applications bilinéaires continues (resp. 
bornées), avec comme bornés les ensem- 
bles équicontinus (resp. équibornés). Dans 
le cas bornologique (mais pas dans le cas 
topologique !), on a des isomorphismes 
canoniques : 

£(E, £(F, G)) = Æ(E, F ; G) ^ £(F, C(E, G)) 

Considérons enfin des espaces vecto- 
riels topologiques E et G et un espace 
vectoriel bornologique F ; on vérifie faci- 
lement que la bijection canonique : 

Hom K (E, Hom K (F, G)) — Hom K (F, Hom K (E, G)) 

induit un isomorphisme d’espaces vecto- 
riels bornologiques : 

£(E, £(F, G)) - £(F, £(E, G)). 

Fes applications bilinéaires cp : 
E X F — ► G correspondant aux éléments 
de ces espaces sont caractérisées par la 
propriété suivante : Pour tout borné B de 
F et tout voisinage Y de 0 dans G, il existe 
un voisinage U de 0 dans E tel que 
cp(U X B) C V ; on dit que ces applica- 
tions bilinéaires sont hypocontinues. Par 
exemple, si E, est un espace vectoriel 
bornologique et si E2 et E3 sont des espaces 
vectoriels topologiques, la composition des 
applications linéaires est hypocontinue de 

C(E„ E 2 ) X C(E 2 , E,) dans C(E„ E,); 

lorsque les structures topologiques et bor- 
nologiques sont réparties différemment 
entre E j , E? et E3, on a une application 
b ilin éaire bornée : 

Z(E ly E 2 )XZ(E 2> E 3 )-*C(E 1 ,E 3 ); 

si Ej et E 3 sont tous deux topologiques 
(resp. bornologiques), il faut imposer à b 2 
d’être aussi topologique (resp. bornologi- 
que). Si F est un espace vectoriel topolo- 
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gique et si E est un espace vectoriel soit 
topologique, soit bomologique, l’appli- 
cation bilinéaire (X, u) !—► u(x) de 
E X C(E, F) dans F est hypocontinue ; 
lorsque E et F sont bornologiques, 
E X L(E, F) — ► F est bornée. 

Soit E et F des espaces vectoriels 
topologiques localement convexes ; on 
note E 0^ F le produit tensoriel de E et F 
muni de la topologie localement convexe la 
plus fine rendant continue l’application 
bilinéaire canonique E X F — E 0 F ;la 
composition avec cette application induit 
alors un isomorphisme : 

C(E 0 „ F, G) — ► Æ(E, F ; G), 

pour tout e.l.c. G. Forsque E et F sont des 
espaces normés, la topologie de E 0^ F 
peut se définir au moyen de la norme : 

|z||, = inf {LlIxJJIyJlz = Ix t ® j>,-} ; 

c’est visiblement une semi-norme : on 
démontre que c’est une norme en utilisant 
le théorème de Hahn-Banach, ce qui 
impose la restriction que le corps K soit 
égal à R, à C ou à un corps maximalement 
complet ; on a : 

II* ®YI, =11*1 . \\y II. 

pour x E E et y E F. Si F et F sont séparés 
(resp. métrisables), il en est de même de 
E 0^ F. Fe produit tensoriel appelé 
produit tensoriel projectif, commute aux 
limites inductives finies. Pour E et F 
bornologiques de type convexe, on définit 
encore un produit tensoriel bomologique 
E 0^ F avec la bornologie de type convexe 
la plus fine rendant E X F — ► E 0 F 
borné ; on a : 

Z(E® n F, G) s=i &(E, F ; G) 

pour tout G bomologique (ou topologi- 
que) de type convexe. Si E et F sont 


séparés, il en est de même de E 0 T F ; le 
produit 0 T bomologique commute aux 
limites inductives quelconques. Supposons 
maintenant E localement convexe et F 
bomologique de type convexe ; on munit 
E 0 F de la topologie localement convexe 
la plus fine qui rende hypocontinue 
E X F — E 0 F, ce qui donne un e.l.C. 
E 0^ F, produit tensoriel mixte de E et F. 
On a, pour tout e.l.c. G, l’isomorphisme : 

C(E 0 * F, G) = $(E, F ; G), 

où #(E, F ; G) est l’espace des applications 
bilinéaires hypocontinues ; il se peut que 
E 0^ F ne soit pas séparé, même si E et F 
le sont ; le produit 0^ mixte commute aux 
limites inductives quelconques. 

Soit F un e.b.c. ; l’application y ► 1 0 y 
est une bijection de F sur K 0 F et permet 
de transporter à F la topologie du produit 
tensoriel mixte K 0^ F. On définit ainsi un 
e.l.c. T dont un système fondamental de 
voisinages de 0 est formé par les disques de 
F qui absorbent tous les bornés ; la topolo- 
gie de ? F s’appelle la topologie canonique 
associée à la bornologie de F. Pour tout 
e.l.c. G, on a : 

C(/F, G) ~ £(K 0 v F, G) ~ £(F, C(K, G)) 

~C(F,ÙG); 

en particulier, l’application identique 
F — ► bt F (resp. th G — G) est bornée (resp. 
continue) et on dit que F (resp. G) est nor- 
mal si c’est un isomorphisme. On peut mon- 
trer que tout e.l.c. métrisable est normal. 

Par complétion de E 0^ F, on obtient le 
produit tensoriel complété E 0 ÏÏ F (topolo 
gique, bomologique ou mixte selon le cas). 
Par exemple, si l’on désigne par l p l’espace 
des suites (y n ) absolument sommables de 
vecteurs d’un espace de Banach F, muni de 

la norme n (y„) fl = E fl y„ fl, on a : 
n ®„f = /J, ; 
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plus généralement, si (X, p) est un espace 
mesuré et F un espace de Banach, on a : 

LUX, g) F = Lp(X, g), 

et on en déduit que, si (Y. v) est un second 
espace mesuré, on a : 

L ! (X, g) ê^CY, v) = LUX X Y, g ® v), 
en utilisant le théorème de Fubini (cf. 

INTÉGRATION ET MESURE). 

5. Espaces disqués 

Sur un espace vectoriel E, on dit qu’une 
topologie 7 i et une bornologie 7 vecto- 
rielles sont compatibles si elles satisfont les 
conditions suivantes : 

(VB,) Tout voisinage de 0 pour 7 
absorbe tout borné de 

(VB 2 ) L’adhérence (pour 7) d’un 
borné de . '7 est encore bornée. 

On appelle espace disque un espace 
vectoriel muni d’une topologie localement 
convexe et d’une bornologie de type 
convexe compatibles. Par exemple, si E est 
un espace localement convexe, on obtient 
un espace disqué E h en le munissant de sa 
bornologie canonique, qui est visiblement 
compatible avec la topologie (cf. début du 
chap. 4) ; on obtient un autre espace disqué 
E^ en prenant comme bornés les parties 
précompactes de E (dans le cas où K est 
localement compact). Si E est séparé, on 
en fait un espace disqué E ( ‘ en prenant 
comme système fondamental de bornés la 
famille des disques compacts ; une autre 
structure disquée E s est définie par la 
bornologie vectorielle la plus fine sur E (cf. 
chap. 3, exemple 3). 

L’espace disqué E est dit séparé si sa 
topologie l’est ; il est dit quasi complet si 
tout borné fermé est complet. Par exemple, 


lorsque E est un e.l.c. séparé, les espaces 
disqués E* et E s sont quasi complets ; si E 
est complet, E^ et Y sont quasi complets 
et l’on a E r , mais les réciproques sont 
fausses. À tout espace disqué E on associe 
un quasi-complété Ê réunion des adhéren- 
ces des bornés de E dans le complété Ê 
(pour la topologie) ; notons que. si E est un 
e.l.c., le quasi-complété de E b n’est plus de 
la forme F ft pour un e.l.c. F. 

Soit E et F des espaces disqués ; on note 
L(E, F) l’espace disqué dont les éléments 
sont les applications linéaires continues et 
bornées de E dans F, dont les bornés sont 
les ensembles à la fois équicontinus et 
équibomés d’applications linéaires et dont 
la topologie est celle de la convergence 
uniforme dans les bornés de E ; il est facile 
de vérifier que la bornologie et la topologie 
sont compatibles. Si F est séparé (resp. 
quasi complet), il en est de même de C(E, 
F). Pour trois espaces disqués E, F et G, 
on a encore un isomorphisme canonique : 

C(E, C(F, G)) = C(F, C(E, G)) 

et on désigne par $(E, F ; G) l’espace 
correspondant d’applications bilinéaires 
de E X F dans G ; ses éléments sont les 
applications bornées et hypocontinues, de 
façon symétrique par rapport à E et F. Par 
exemple, la composition des applications 
est une application bornée et hypoconti- 
nue : 

C(Ej, E 2 ) X C(E 2) E 3 ) — ► CfEj, E 3 ), 

les espaces Ej, E 2 et E 3 étant disqués ; 
l’application („Y, Ü) ► u(x) de E X C(E, F) 
dans F est bornée et hypocontinue, pour E 
et F disqués. Si E et F sont des e.l.c. séparés 
et G un espace disqué, toute application 
bilinéaire tp de E v X F s dans G est bornée ; 
si cp est hypocontmue, on dit qu elle est 
séparément continue. Les applications bili- 
néaires que l’on rencontre en analyse sont 
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généralement hypocontinues pour des 
structures disquées convenables, mais rare- 
ment continues. 

Le théorème de Banach-Steinhaus est 
lié à la structure des espaces C(E, F) et 
#(E, F ; G). Il s’énonce ainsi (cf. espaces 
vectoriels normÉs, chap. 4) : 

Théorème . a) Soit E et F des espaces 
disqués ; on suppose que la topologie de E 
est une topologie de Baire. Alors tout 
ensemble équiborné d’applications linéai- 
res continues de E dans F est équicontinu. 

b) Soit E, F et G des espaces disqués ; 
on suppose que E et F sont métrisables et 
que l’un d’eux est complet. Alors tout 
ensemble équihypocontinu d’applications 
bilinéaires de E X F dans G est équicon- 
tinu. 

De (a) on déduit par exemple que, si 
une suite (u„) d’applications linéaires conti- 
nues de E dans F converge simplement 
vers une limite w, cette limite est encore 
linéaire continue ; car l’ensemble {u n } est 
simplement borné, donc équicontinu et, 
par suite, son adhérence [u n } n U { u } est 
encore équicontinue. 

La propriété de Baire n’est pas néces- 
saire pour la conclusion de (a). On dit 
qu’un espace disqué E est infratonnelé si, 
pour tout espace disqué F, toute partie 
équibomée de C(E, F) est équicontinue ; il 
revient au même de dire que tout disque 
fermé de E qui absorbe les bornés est un 
voisinage de 0. Pour qu’un espace disqué 
E soit infratonnelé, il faut et il suffit que 
toute application linéaire bornée de E dans 
un espace de Banach soit continue dès que 
son graphe est fermé. Si E et F sont des 
espaces disqués métrisables dont l’un est 
infratonnelé, tout ensemble équihypocon- 
tinu d’applications bilinéaires de E X F 
dans un espace G est équicontinu. Tout 
quotient d’un espace infratonnelé est infra- 
tonnelé ; la somme et le produit d’une 


famille d’espaces infratonnelés sont infra- 
tonnelés. On dit qu’un espace localement 
convexe E est tonnelé (resp. quasi-tonnele’) 
si E* (resp. E ft ) est infratonnelé ; les espaces 
de Fréchet sont tonnelés et les e.l.c. 
métrisables sont quasi-tonnelés. 

Le produit tensoriel E ® F de deux 
espaces disqués est muni de la structure 
disquée (topologie et bomologie) la plus 
fine rendant bornée et hypocontinue 
l’application bilinéaire canonique 
EX F — ► E 0 F ; on le note E 0^ F et on 
a : 

C(E® W F,G)^Æ(E,F;G) 

pour tout espace disqué G. Le produit 
tensoriel disqué 0^ commute aux limites 
inductives ; si E et F sont séparés (resp. 
infratonnelés), il en est de même de 
E 0^ F. On définit ainsi différentes struc- 
tures disquées sur le produit tensoriel de 
deux e.l.c. E et F séparés : le produit 
tensoriel « inductif » : 

F ® F = E- y <8> F* 
et les deux structures : 

E ® ^ F = E c ® * F c , 

E ® ^ F = E* ® * F b ; 

lorsque E et F sont tonnelés, les topologies 
sous-jacentes à ces trois structures coïnci- 
dent et font de E 0 F un e.l.c. tonnelé. Les 
trois topologies coïncident encore si les 
espaces E et F sont métrisables, l’un d’eux 
étant tonnelé : ces topologies sont alors 
identiques à celle du produit tensoriel 
topologique E 0^ F. 

6. Dualité 

Soit E un espace vectoriel topologique, 
bornologique ou disqué ; son dual est, par 
définition, l’espace C(E, K) = E’ des for- 
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mes linéaires sur E. Ainsi, le dual d’un 
espace vectoriel topologique (resp. borno- 
logique, disqué) est un espace vectoriel 
bornologique (resp. topologique, disqué). 
Par exemple, on définit l’espace C’(X) des 
distributions à support compact dans une 
variété différentiable X, l’espace S’ des 
distributions tempérées dans R 77 et l’espace 
O’(U) des fonctionnelles analytiques dans 
l’ouvert U de C n comme les duaux respec- 
tifs des e.l.c. donnés dans les exemples 4, 
5 et 6 du chapitre 1 ; l’espace ‘D’(X) des 
distributions dans X est le dual de l’exem- 
ple 4 du chapitre 3 et l’espace O'(U) des 
fonctionnelles analytiques dans U peut 
encore être défini comme le dual de 
l’exemple 5 du chapitre 3 (cf. distribu- 
tions) . Si E est un e.b.c., on a : 

CE) - = C(‘E, K) ^ C(E, *K) =, *(E') ; 

en particulier, si F est un e.l.c. normal 
(cf. chap. 4), par exemple métrisable, on a 
E’ = ^E)'). Le dual d’ un e.l.c. séparé E 
admet diverses structures disquées, avec 
toujours la même bornologie, dont les 
bornés sont les ensembles équicontinus de 
formes linéaires : le dual faible E’, = (E’)‘, 
muni de la topologie de la convergence 
simple dans E ; l’espace E’, = (E‘‘)\ muni 
de la topologie de la convergence uniforme 
dans les disques compacts de E ; le dual 
fort E’ h = ( E*)', muni de la topologie de la 
convergence uniforme dans les parties 
bornées de E. Si E est un e.l.c. normal, on 
a l’égalité E'/, = (( A E)') ft ; les duaux forts 
d’espaces de Fréchet ont des applications 
importantes en analyse complexe et ont été 
systématiquement étudiés par A. Grothen- 
dieck. 

Le bidual E” = (E’)’ d’un espace E a 
une structure de même nature que celle de 
E et on a un morphisme de bidualité 
E — ► E” (cf. algèbre linéaire et MULTILI- 
NÉAIRE) ; ce morphisme est strict. Lorsque 


E est un e.l.c. ou un espace disqué séparé, 
le morphisme de bidualité est injectif ; il 
résulte en effet du théorème de Hahn- 
Banach (cf. convexité) que, pour tout 
élément x ^ 0 de E, il existe un f E E’ tel 
que x’(x) 7^ 0 (prolonger à E une forme 
linéaire non nulle définie sur la droite Kx). 
Il n’en est plus de même pour un e.b.C. E, 
car il se peut qu’on ait E’ = 0 même si E 
est séparé et non nul ; pour que E — ► E” 
soit injectif, il faut et il suffit que E soit 
séparé et que sa bornologie soit compatible 
avec la topologie canonique associée, c’est- 
à-dire que l’adhérence dans ‘E d’un borné 
de E soit encore bornée : on dit alors que 
E est régulier. Tout e.b.c. séparé normal est 
régulier ; toute limite projective et toute 
somme d’e.b.C. réguliers sont régulières. Si 
E et F sont des e.l.c. et si F est séparé, alors 
C(E, F) est régulier ; il en est de même si 
E est un e.l.c. ou un e.b.c. et si F est un 
e.b.c. régulier. 

On dit que E est réflexif si le morphisme 
de bidualité est un isomorphisme E ^ E”. 
Par exemple, soit (X, jj) un espace mesuré 
etp un nombre réel > 1 ; l’espace 1/ (X, p) 
des classes de fonctions de puissancep-ième 
intégrable (cf. chap. 1, exemple 2) est 
réflexif, car son dual est isomorphe à 
IA(X, p), avec 1 fp -\-\/q = 1 (Cf . intégra- 
tion ET ME~URE) . Sur un corps ultramétri- 
que K, les seuls espaces normés réflexifs 
sont les espaces de dimension finie. On dit 
qu’un espace localement convexe E est un 
espace de Schwartz si, pour toute applica- 
tion linéaire continue / de E dans un espace 
de Banach, il existe un voisinage U de 0 
dans E tel que f (U) soit relativement com- 
pact ; ainsi, l’espace C(X) de l’exemple 4 du 
chapitre 1, l’espace O(U) de l’exemple 6 du 
chapitre 1 et l’espace ‘d>‘(X) des distribu- 
tions (cf. supra) sont des espaces de 
Schwartz : cela résulte du théorème des 
accroissements finis et du théorème 
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d' Ascoli ; on peut montrer que les espaces 
de Schwartz complets sont réflexifs. Pour 
tout e.l.c. séparé E, les espaces disqués E J et 
E r sont réflexifs ; si E est réflexif, il en est de 
même de ; mais la réciproque n’est pas 
vraie en général. 

La théorie de la dualité se développe à 
l’aide de la notion de système dual; on 
appelle ainsi un triplet (E, F, u) où E et F 
sont des espaces vectoriels et où U : 
E X F — ► K est une forme bilinéaire. Pour 
toute partie X de E, on appelle polaire de 
X l’ensemble : 

X°= {y E F| Vx G X, | w(x,y)| < U; 

de même, on définit le polaire Y 0 C E 
d’une partie Y de F. Il est clair que X° est 
un disque et que l’application X — * X° est 
décroissante. De plus, on a : 

XCX 00 , 

X° = X 000 , 

et (ÀX)° = (1 /X)X°, pour A G K* ; enfin, 
pour toute famille (X,) de parties de E, on 
a : 

(u x ‘)°=n x ?-(n x 0° 3 U x ° 

Si l’on a X C E et Y C F, pour que X° 
absorbe Y, il faut et il suffit que Y 0 absorbe 
X. Considérons un autre système dual (E„ 
F], u j) et des applications linéairesfde E 
dans Ej et g de F, dans F telles que : 

u\{f{x\yù = u{x,gty x )), 

pour x G E et y\ G Fj ; si on a X C E, il 
vient (f(X))° = 

Soit (E, F, u) un système dual ; on note 
°E l’espace E muni de la topologie faible 
dont un système fondamental de voisina- 
ges de 0 est formé par les polaires de 
parties finies de F (topologie de la conver- 
gence simple dans F). L’adhérence de 0 
dans a E est F 0 et le dual de a E s’identifie, 


au moyen de u, à F/E° muni de la 
bornologie vectorielle la plus fine. Le 
bipolaire X 00 d’une partie X de E est son 
enveloppe disquée faiblement fermée, 
c’est-a-dire fermée dans °E ; ce résultat, 
connu sous le nom de théorème des bipo- 
laires, se démontre à partir du théorème de 
Hahn-Banach. Les parties faiblement bor- 
nées de E (bornées de Ao E) sont exactement 
les parties faiblement précompactes. Appli- 
quons cela au système dual (F’, F, u) où F 
est un e.l.C. et où u(x\ x) := x’(x) pour 
x G F et x’ GF’ : la topologie faible de F’ 
est celle de FJ.' et ses parties équicontinues 
sont faiblement bornées ; or les disques 
équicontinus sont les polaires dans le dual 
algébrique F* des voisinages de 0 dans F, 
ce qui montre qu’ils sont complets pour la 
topologie faible, car ce sont des fermés 
dans F* qui est complet. On démontre 
ainsi le théorème suivant, qui généralise le 
« principe de choix » de Hilbert (théorème 
d’Alaoglu pour les espaces normés) : 

Théorème. Soit F un e.l.c. : les parties 
équicontinues de F’ sont faiblement rela- 
tivement compactes, c’est-à-dire d’adhé- 
rence compacte dans F’,. 

Voici un autre résultat fondamental de 
la théorie : 

Théorème de Mackey. Soit (E, F, u) un 
système dual ; on suppose E et F munis de 
bornologies de type convexe compatibles 
avec les topologies faibles et telles que u 
soit borné et on munit E (resp. F) de la 
topologie dont un système fondamental de 
voisinages de 0 est formé des polaires de 
bornés de F (resp. E). Si les bornés de E 
et de F sont précompacts pour les topo- 
logies précédentes (ce qui revient à dire 
que l’application u est faiblement continue 
sur le produit d’un borné de E par un 
borné de F), le dual de E s’identifie, au 
moyen de u , au quasi-complété de F. 
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Supposons maintenant F faiblement 
séparé (soit E° = 0) ; on appelle topologie 
de Mackey sur E la topologie dont un 
système fondamental de voisinages de 0 est 
formé des polaires de disques faiblement 
compacts de F. Il résulte du théorème de 
Mackey que la topologie de Mackey sur E 
est la plus fine des topologies pour lesquel- 
les toute forme linéaire continue peut 
s’écrire x »— ► u(x , y) pour un y (E F. 

CHRISTIAN HOUZEL 

Bibliographie 

s. Banach, Théorie des opérations linéaires, Varsovie, 
1932, plusieurs fois réédité / n. Bourbaki, Espaces 
vectoriels topologiques , chap. I à v. nouvelle version, 
Masson, Paris, 1981 / A. Grothendieck, Espaces 

vectoriels topologiques , Publicaçào de Sociedade de 
Mathemâtica de Sào Paulo, 2 e éd., 1958 /C. Houzel, 
Séminaire Banach. Springer, Berlin. 1972. 


TRANSCENDANTS nombres 


S i la notion de nombre irrationnel 
remonte aux Grecs, l’idée de nombre 
transcendant n’a pu se dégager qu’ après la 
création de notations algébriques assez 
développées pour que le concept de poly- 
nôme de degré quelconque puisse être clai- 
rement formulé ; aussi est-ce seulement au 
XVII e siècle que l’on commence à faire la 
distinction entre les nombres algébriques , 
tels V3/2 ou COS (7 ïjn) pour n entier, qui 
sont racines de polynômes à coefficients 
entiers, les autres nombres réels étant qua- 
lifiés de transcendants. L’existence de nom- 
bres transcendants n’a été prouvée qu’au 
XIX e siècle ; s’il est facile de construire des 
nombres transcendants, la question de 
savoir si un nombre donné est ou non 
transcendant est généralement un pro- 


blème fort difficile. L’exemple le plus célè- 
bre est celui du nombre 7T, dont la transcen- 
dance n’a été démontrée qu’en 1882 ; ce 
résultat prouvait définitivement l’impossi- 
bilité de la « quadrature du cercle », c’est- 
à-dire le problème, posé depuis les Grecs, 
de la construction géométrique « par la 
règle et le compas » d’une longueur égale à 
la circonférence de diamètre unité ; il est 
facile, en effet, de montrer qu’une telle 
construction ne peut jamais donner que des 
longueurs dont la mesure est un nombre 
algébrique (et même un nombre algébrique 
d’un type très particulier). 

L'existence 

des nombres transcendants 

Il est commode d’étendre la définition 
des nombres algébriques aux nombres 
complexes, et d’appeler encore nombre 
transcendant un nombre complexe non 
algébrique. J. Liouville a établi, en 1844, 
l’existence des nombres transcendants par 
une construction fondée sur la propriété, 
découverte par lui, de « mauvaise appro- 
ximation » des nombres irrationnels algé- 
briques par les nombres rationnels (cf. 
approximations diophantiennes ) . En 
1873, G. Cantor déduisit l’existence des 
nombres transcendants de son théorème 
prouvant que l’ensemble de tous les nom- 
bres réels est non dénombrable : il suffit, en 
effet, de prouver que l’ensemble A de tous 
les nombres algébriques est dénombrable. 
Pour cela, associons à chaque polynôme à 
coefficients entiers : 

P(X) = a 0 X « + ^X"- 1 + 4- a,, 

sa hauteur : 

ht(P) = max /a, 

J 
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Comme un polynôme n’a qu’un nom- 
bre fini de racines, l’ensemble A N des 
nombres algébriques qui sont racines 
de polynômes à coefficients entiers de 
degré ^ N et de hauteur ^ N est un 
ensemble fini \ comme A est réunion des 
A„ pour N = 1, 2, ,,, l’ensemble A est 
dénombrable. 

L’ensemble des nombres transcendants 
n’est donc pas dénombrable ; en termes 
imagés, on peut dire qu’un nombre pris au 
hasard (par exemple en se donnant au 
hasard son développement décimal illi- 
mité) n’a « aucune chance » d’être algé- 
brique. 

Valeurs transcendantes 
de fonctions entières 

Le premier résultat profond sur les 
nombres transcendants fut obtenu par 
C. Hermite en 1872 : par une méthode 
très originale reposant sur l’approxima- 
tion de la fonction exponentielle e : par 
des fonctions rationnelles, il put montrer 
que le nombre e est transcendant, et 
c’est par une extension de la méthode 
d’Hermite que Ferdinand von Linde- 
mann, en 1882, prouva que TT est aussi 
transcendant. De nouveaux résultats de 
cette nature n’apparurent qu’ après 1929 ; 
ils concernent, comme les précédents, 
des nombres qui sont des valeurs prises 
par certaines fonctions entières ou méro- 
morphes (ou leurs fonctions inverses) 
pour des valeurs algébriques de la varia- 
ble ; les méthodes, développées à partir 
d’idées de C. L. Siegel et de A. Gelfond, 
raffinées par T. Schneider et récemment 
par A. Baker, utilisent, comme celle 
d’Hermite, des propriétés des fonctions 
entières d’une variable complexe. Aucune 
méthode n’a encore été trouvée pour 
des nombres qui ne sont pas donnés de 


cette manière, par exemple la constante 

d’Euler : 

Y = (' + \ + 3 + + n ~ Log " )’ 

dont on ne sait même pas si elle est 
irrationnelle (cf. calculs ASYMPTOTIQUES 
chap. 2). 

Les théorèmes d’Hermite et de Linde- 
mann sont des cas particuliers du résultat 
suivant. 

Théorème L Un nombre complexe 
a 0 ne peut être tel que a et e n soient 
tous deux algébriques. 

En effet, ce théorème entraîne, en 
faisant <3 = 1, que e est transcendant et, en 
faisant a = /TT, que TT est transcendant. 

La méthode d e Siegel-Gelfond- 
Schneider déduit le théorème I d’un 
théorème plus général concernant les 
valeurs de deux fonctions entières liées par 
des équations différentielles algébriques : 

Théorème IL Soit f et g deux fonctions 
entières d’ordre fini p, c’est-à-dire vérifiant 
des majorations, 

|/0O| < exp (a |z| p ), 

^ \g(z) \ ^ exp {a \z\ p ), 

pour tout z G C. On suppose que : 

1° Les fonctions f et g sont algébrique- 
ment indépendantes, c’est-à-dire qu’il 
n’existe aucun polynôme P(X, Y) non 
nul à coefficients complexes tel que 

P(/(z),£(j)) = 0. 

2” On a des relations différentielles : 

f\z) = Q(/'(z),g(z)), 

W g'(z) = R</XzU(z)), 

où Q et R sont des polynômes à coeffi- 
cients dans un corps de nombres algébri- 
ques K de degré fini d sur le corps des 
rationnels Q. 

Supposons alors qu’il y ait m nombres 
complexes distincts W\, . . . . W m tels que 


871 



TRANSC ENDANTS NOMBRES 


les 2m nombres f (Wj) et g{wj) appartien- 
nent à K. Cela n’est possible que si 
ni ^ K) pd. 

Pour en tirer le théorème 1, on prend 
f(z) = z et g(z) = e : > qui vérifient les 
conditions (1) et (2) ; si a et e a étaient 
algébriques, ils appartiendraient à un 
même corps de nombres K de degré 
fini ; mais alors tous les nombres ïl(X 
et e na appartiendraient aussi à K pour 
tout entier n , ce qui contredit le théo- 
rème IL 

Si p est un nombre algébrique irration- 
nel, les fonctions e { et vérifient les 
conditions du théorème II en prenant pour 
K un corps contenant (3. On en déduit le 
théorème de Gelfond-Schneider ; 

Théorème III. Si a est un nombre algé- 
brique autre que 0 et 1 et p un nom- 
bre algébrique irrationnel, le nombre 
a P = exp (p Log a), avec une détermina- 
tion quelconque du logarithme, est trans- 
cendant. 

En effet, dans le cas contraire, les 
valeurs de e l et e ^ pour tous les nom- 
bres H Log a, avec U entier quelconque, 
appartiendraient à un corps K’ conte- 
nant a et a 13 , contrairement au théo- 
rème II. 

Par exemple, le nombre et le 

nombre e K , qui est une détermination de 
(- 1)“', sont transcendants. 

L’idée de la démonstration du théo- 
rème II est de former une suite (L,(z)) de 
fonctions entières d’ordre p, où l’indice s 
prendra des valeurs entières arbitrairement 
grandes , qui possèdent les propriétés sui- 
vantes, où C„ C 2 , sont des constantes 
indépendantes de s , 

(а) j Es (z) i < s 2s exp (CjS 1/2 \z \ p), 

(б) = °- 

0^/c<5', 1 < j ^ m. 


(c) Il existe un Hÿ, par exemple w j, tel 
que : 

(à)* p , (Wi) = -r ^ °> 


et tel que : 

(3) l'y— 1 1 < C 2 sW-n*. 

On remarque alors que la fonc- 
tion : 


G(z) = 


F,fr) 

(z—w x y...(z—w m y 


est une fonction entière en vertu de (b) qui, 
pour z ^ R, où R est assez grand, vérifie, 
en vertu de (a) et du principe du maximum, 
l’inégalité : 

(4) G (z) < R— ms s is exp(C 2 s 1/2 R p ). 


D’autre part, on a : 

ï = (jj~) F *(»'i) = i!G(Mi 1 ) JJ (Wi — Wj)'. 

;=î 

On prend R = s l ^ 2p \ et on déduit de (4) 
la majoration : 

(5) , 

et, en comparant avec la minoration de y 
donnée par (3), on obtient aisément 
m ^ 10 pd. 

Tout revient donc à satisfaire aux condi- 
tions (a), (b) et (c). On se donne un entier 
r arbitrairement grand divisible par 2m et 
on pose fl = r 2 /( 2 m). On considère la 
fonction : 


f (z) - 2 ^ 

où l’on détermine les coefficients b^ v dans 
K tels que : 

< 6 ) (iï F(M '^ ) ■ °- 

0 < Æ < « , 1 j ^ m. 
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C’est un système de mn équations 
linéaires à r 2 = 2 mn inconnues b^ v , dont 
les coefficients sont par hypothèse dans K, 
en vertu des relations (2) et de l’hypothèse 
sur les f (h^) et g(w y ). On montre par 
des majorations élémentaires que l’on 
peut prendre pour solutions b MV de ce 
système des entiers de K non tous nuis tels 
que : 

(7) M< C 4« 2 ’- 

L’hypothèse que / et g sont algébrique- 
ment indépendantes implique alors que F 
n’est pas identiquement nulle. Il y a donc 
un plus petit entiers tel que F = vérifie 
(b) et que : 



ne soit pas nul pour un j au moins ; en vertu 
de (6), on a nécessairement s ^ n. On 
prouve élémentairement qu’il y a un nom- 
bre rationnel c ^ 0 5 tel que Cf soit un 
entier algébrique de K et que Cf et tous ses 
conjugués soient majorés par C 6 S 5s en 
valeur absolue. Pour la norme de Cf, qui est 
un entier rationnel non nul, on a alors les 
inégalités : 

1 < |Nk/o(cy)| < C 7 s 5 <‘ , -')*|- r |, 

ce qui donne (3) ; quant à la majoration (u) 
de F p elle se déduit aisément des majora- 
tions defet g et de (7). 

A. Baker a généralisé les théorèmes I et 
III ; désignons par L l’ensemble des nom- 
bres complexes z tels que e~ soit un nombre 
algébrique ; c’est évidemment un SOUS- 
espace vectoriel de C sur le corps Q des 
nombres rationnels. Alors, on a les résul- 
tats suivants de Baker : 

Théorème IV. (a) Si Zj, . . . . z n sont des 
éléments de L linéairement indépendants 
sur Q, ils sont aussi linéairement indépen- 
dants sur le corps de tous les nombres 


algébriques, autrement dit il ne peut exister 
de relation : 

Pi z i + ••• + = 0, 

avec des coefficients algébriques |3j, . . . . 
non tous nuis. 

(h) Si Zj, . . . . z n sont des éléments de L, il 
ne peut exister de relation : 

Po = Pl z l + ••• + $n z n> 

où p o , (3 b . . . . [3, j sont des nombres algé- 
briques et où l’on a (3 0 ^ 0. 

On déduit aussitôt du théorème IV 
que, si (3j, . . . . p sont des nombres algé- 
briques tels que 1, (3j, . . . . (3„ soient linéai- 
rement indépendants sur Q, alors le nom- 
bre : 

a i' a ? 2 a|j* 

est transcendant pour tous les oty algébri- 
ques différents de 0 et de 1. De même, si 
oq, ... . a„, Po» Pi> • • • • sont des nombres 
algébriques non nuis, le nombre : 

e Po af‘ . . a P« 

est transcendant. On déduit aussi par 
exemple du théorème IV que TT + Log Q 
est transcendant pour tout nombre algé- 
brique d^O. 

La méthode de démonstration du théo- 
rème IV est une extension de celle du 
théorème II, mais utilisant une technique 
plus subtile ; pour (h), par exemple, on 
raisonne par l’absurde en supposant l’exis- 
tence d’une relation : 

z n = Po + Pl*l + ... + P 

et on considère la fonction entière de n 
variables complexes q, . . . . t n _\ '■ 

P(K‘-‘’K)‘o°ex pu(t 0 ,...,t„). 
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où ; 

U{t Q , ty, ...» t n ) = k n |3 0 / 0 + (^1 + ^«Pl) Z l t\ 

+ ■■• + (bn — 1 + l) z n — 1 K— 1 » 

les \ n étant des entiers tels que O S? A, < C,. 
On impose aux/?(À) d’être entiers et choisis 
de sorte que <î> et toutes ses dérivées 
partielles jusqu’à un ordre C 2 s’annulent 

lorsqu’on y fait î { — t 2 — = t n _ x = H 

et que w est un entier tel que 0 ^ Vf ^ Cy 
Par un choix convenable des constantes Cj, 
6 * 2 , C 3 et l’emploi de majorations tirées de 
la théorie des fonctions holomorphes, on 
aboutit à une contradiction. 

Indépendance algébrique 
de nombres transcendants 

La transcendance d’un nombre a signifie 
qu’il n’est pas racine d’un polynôme à 
coefficients entiers. Plus généralement, n 
nombres complexes a„ a->, . . . . a,, sont dits 
algébriquement indépendants s’il n’existe 
aucun polynôme non nul P(T t , .... T,,) à n 
indéterminées et à coefficients entiers tel 

que P(a, a„), = 0 , ce qui implique bien 

entendu que a„ a,, sont transcendants. 
On n’a que peu de résultats sur cette 
question ; par exemple, on ignore si e et tt 
sont algébriquement indépendants. On 
conjecture que, sous les conditions (a) du 
théorème IV, les Z ; sont algébriquement 
indépendants. 

Les résultats positifs les plus intéres- 
sants sont les suivants : 

Théorème V (Lindemann). Si a„ ..., a„ 
sont des nombres algébriques linéairement 
indépendants sur Q, les nombres e a \. . . . e Un 
sont algébriquement indépendants. 

Théorème VI (Siegel). Si J’,, est la 
fonction de Bessel d’indice 0, alors les 
nombres J,, (a) et J'o((x) sont algébrique- 
ment indépendants pour tout nombre algé- 
brique a 0. 


Une même méthode, due à Siegel, 
permet de démontrer ces deux résultats. 
Elle applique une idée analogue à celle de 
la démonstration du théorème II, utilisant 
le fait que les fonctions e uz et Jq(z) vérifient 
une équation différentielle linéaire homo- 
gène et des majorations tirées de la théorie 
des fonctions analytiques ; mais les détails 
de la démonstration sont beaucoup plus 
délicats et compliqués. 

JEAN DIEUDONNÉ 
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L ? étude d’une fonction à valeurs réelles 
comporte en particulier la détermi- 
nation de ses extrémums. C’est là un des 
objets du calcul différentiel classique lors- 
que la source de cette fonction est un 
espace numérique ; c’est l’objet de ce 
qu’Euler a appelé le calcul des variations 
lorsque cette source est un espace fonc- 
tionnel. 

On rencontre déjà dans la plus haute 
antiquité des problèmes d’une telle nature. 
La légende ne veut-elle pas que Didon, 
lorsqu’elle fonda Carthage, ait délimité 
la plus grande étendue qu’elle pût cir- 
conscrire à l’aide de lanières découpées 
dans la peau d’un taureau? Et il est 
bien connu que les Grecs caractérisaient 
un segment de droite comme la ligne de 
plus petite longueur joignant ses extrémi- 
tés. 

Ce n’est cependant qu’au XVIII e siècle, 
à la suite de l’essor du calcul infinitésimal, 
qu’Euler et Lagrange établirent les fonde- 


ments du calcul des variations et donnè- 
rent une première condition d’extrémum. 
Cette équation d’ Euler-Lagrange allait 
jouer un rôle très important, surtout en 
physique, où elle justifiait les principes 
variationnels : principe de FeYYYlüt pour la 
propagation de la lumière dans les milieux 
différemment réfringents ; principes de 
moindre action de Maupertuis et Hamilton 
pour la détermination des mouvements en 
mécanique analytique. 

La recherche de conditions d’extré- 
mum se poursuivit aux XVIII e et XIX e siècles, 
notamment avec les travaux de Legendre, 
Jacobi et Weierstrass, pour aboutir au 
début du XX e siècle à une théorie bien 
élaborée que l’on situe aujourd’hui dans 
le cadre du calcul différentiel au sens 
de Fréchet dans les espaces de Banach. 
Mais de difficiles problèmes relatifs à 
l’existence de ces extrémums restent 
encore ouverts. 

Plus récemment, les travaux de Morse 
relancèrent l’intérêt porté au calcul des 
variations. Utilisant à la fois des techni- 
ques d’analyse fonctionnelle, de topologie 
algébrique et de topologie différentielle, ils 
sont à l’origine de ce qu’on appelle main- 
tenant l’analyse différentielle globale, une 
des théories carrefours de la mathématique 
actuelle. 

Il faut enfin mentionner le contrôle 
optimal, terminologie d’origine anglo- 
saxonne fréquemment remplacée par 
« commande optimale ». Par ses problè- 
mes d’optimisation de fonctionnelles sur 
des espaces de solutions d’équations dif- 
férentielles avec paramètres de contrôle, il 
s’intégre en effet au calcul de variations. 
Mais la recherche de solutions qui peuvent 
être discontinues y conduit au développe- 
ment de techniques fort différentes ; on 
n’en parlera pas ici. 
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ment, on est ici amené à minimiser l’inté- 
grale : 


Quelques problèmes classiques 


J = 2 tu 1 y VI + y ' 2 dx . 


La brachistochrone 

On considère dans le champ de la pesan- 
teur deux points A et B et un point matériel 
M se déplaçant sans frottement sur une 
courbe d’extrémités A et B. Déterminer la 
courbe, appelée brachistochrone, pour 
laquelle le temps de parcours est minimal 
lorsque le point M part du point A avec 
une vitesse nulle. 

Ce problème, dont la solution est en 
général un arc de cycloïde, avait déjà été 
considéré par Galilée, qui avait remarqué 
que ce minimum n’était pas réalisé par le 
segment de droite. Résolu en 1697, en 
particulier par Jean Bernoulli, Jacques 
Bernoulli et Newton, il allait attirer l’atten- 
tion des mathématiciens de l’époque sur 
les problèmes variationnels. 

En admettant que sa solution soit 
une courbe plane ayant une équation de 
la forme y =f(x), on peut en donner 
la formulation analytique suivante : 
Déterminer la fonction continûment déri- 
vable y = f (a) vérifiant les conditions 
/O‘o) = >’o et /(a-,) = J, qui minimise 
l’intégrale : 


J = 


VTTT 1 J 

dx. 

J J0 V2g(y 0 — J) 


La solution est en général un arc de 
chaînette : 


OÙ ch désigne le cosinus hyperbolique. 

Les géodésiques 

Étant donné une surface S dans R 3 et deux 
points A et B de S, déterminer les courbes 
tracées sur S d’extrémités A et B et de 
longueur minimale. 

De ce point de vue, le problème de la 
distance d’un point à une courbe suggère, 
d’ailleurs, la généralisation des exemples 
précédents à la considération de courbes 
dont les extrémités sont non pas fixées mais 
mobiles sur deux courbes données (pro- 
blèmes variationnels à extrémités varia- 
bles). 

Le problème isopérimétrique 
Déterminer parmi les courbes planes fer- 
mées sans point double de longueur don- 
née celle dont l’intérieur a la plus grande 
surface : c’est le problème de Didon. 

Ce problème, dont la solution est le 
cercle, est un problème d’extrémum lié. Il 
fut résolu par Jacques Bernoulli en 1697 et 
joua également un rôle important dans 
l’essor du calcul des variations. 


La surface minimale de révolution 
Étant donné dans un plan P un axe 3 et 
deux points A et B situés d’un même côté 
de A, déterminer la courbe du plan P, 
d’extrémités A et B, engendrant par révo- 
lution autour de A une surface dont Faire 
est minimale. Sous des hypothèses analo- 
gues à celles qui ont été faites précédem- 


Le problème de Plateau 
Les quatre exemples précédents concer- 
nent des espaces de courbes : on dit que ce 
sont des problèmes variationnels de dimen- 
sion 1 . On peut bien évidemment conce- 
voir des problèmes de dimensions supé- 
rieures. Le plus célèbre d’entre eux est 
celui du physicien belge J. Plateau : Étant 
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donné dans l’espace une courbe fermée 
sans point double, déterminer une surface 
d’aire minimale ayant cette courbe pour 
bord. Ce problème est essentiel dans 
l’étude des lames minces liquides. 

Présentation analytique 
d'un problème variationnel 

À la lumière des exemples qui viennent 
d’être présentés, on peut donner la formu- 
lation suivante d’un problème variationnel 
simple de dimension 1 à extrémités fixes. 

Soit 3) l’espace affine des fonctions f à 
valeurs réelles continûment dérivables sur 
l’intervalle [a, b] et vérifiant f(u) = a et 
f(h) = p. L’espace vectoriel £ associé à 
cet espace affine peut s’interpréter comme 
l’espace des fonctions ü) continûment 
dérivables sur [a, b] et vérifiant 
o(a) = tù(b) = 0. 

On munit l’espace 3) des deux topolo- 
gies r 0 et ' définies respectivement par 
les normes de la convergence uniforme : 

l/l = su p !/(•*) . 

10,01 

ll/lli = sup (|/(x)| + |/'(*)|). 

[a, b] 

La topologie r ^" 1 est plus fine que la 
topologie V? °. 

Soit F(JC, y , y’) une fonction à valeurs 
réelles deux fois continûment différentia- 
ble sur l’espace [a, b] X R X R. On peut 
lui associer la fonctionnelle J sur 2) déter- 
minée par : 

/~£f(^/(* ),/'(*))<&. 

On dit alors qu’une fonction f de 2) est 
une solution du problème variationnel 
correspondant à la fonction F si elle est un 
minimum de J sur 2), c’est-à-dire si l’on a 
i(J ) ^ J(g) pour tout g G 2). On dit éga- 
lement que f est un minimum relatif faible 
(resp. fort) de J s’il existe e > 0 tel que l’on 


ait J (f) ^ J(g) pour tout g G 2) vérifiant 

II/- S lli < E (resp. \\f-g\\ < e). 

Naturellement un minimum au sens 
fort est également un minimum au 
sens faible. Mais cette distinction se 
trouve justifiée par le fait que la fonc- 
tion J, qui est continue pour la topologie 
'/'f 1 , ne l’est pas en général pour la 
topologie '/f 0 . 

On peut maintenant, avec 

J. L. Lagrange, considérer un élément y de 
£ comme une « variation » de la fonction 
f de 2) en introduisant la fonction 
g = f -f- oj. La formule de Taylor permet 
alors d’écrire, à des termes d’ordres supé- 
rieurs près (pour la norme ||.|| t ), la varia- 
tion J(g) — J (f) sous la forme : 

| /’(*)) <40 

+ F;<* ,f{x ),/'(* )) G)'(x )] dx. 

On peut donc dire que la fonctionnelle : 

J 6 [F' y (ù + F^o'] dx 

est la dérivée de la fonction J au point f 
lorsqu’on munit l’espace 2) de la topologie 

*. Avec Lagrange, on notera cette déri- 
vée bJ[f] et l’on dira qu’elle est la « varia- 
tion première » de J en f. 

On a ainsi démontré qu’une condition 
nécessaire pour que f soit un minimum 
relatif faible (et a fortiori fort) de J est que 
l’on ait ôJ| /] = 0. 

Équation d'Euler-Lagrange 

Si l’on suppose que f est un minimum 
relatif faible de J deux fois continûment 
dérivable, on peut transformer l’expres- 
sion de ÔJ \f] en intégrant par partie le 
second terme. On obtient ainsi : 

5J[/"](oj) = £o[f;-^(f;.)](/x. 
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Ce qui conduit à l’équation donnée par 
Euler en 1744 : 

Théorème 1. Une condition nécessaire 

pour qu’une fonction f deux fois continû- 
ment dérivable soit un minimum relatif 
faible de J est qu’elle vérifie l’équation : 

F, [F;.(x,/(* ),/'(*))] = 0. 

Ce résultat est une conséquence immé- 
diate du lemme suivant : 

Lemme 1. Soit h une fonction continue 
sur [a, b]. Si l’on a : 

j*s(x)h( X )dx =0 

pour toute fonction £ continûment dériva- 
ble sur [a, b] et vérifiant e(ü) = E {b) = 0, 
on a h = 0 sur [a, h]. 

Démonstration du lemme 1. Supposons 
que la fonction h soit, par exemple, posi- 
tive en un point Xq de ]a, b[. On peut alors 
trouver un intervalle [c, d] contenant x 0 sur 
lequel h est positive. 

Si l’on désigne par e la fonction égale à 
(x c) 2 (d-x)’ sur [ c , d] et nulle en 
dehors de [c, d\ y on a dans ces conditions : 

t(x )h(x)dx > 0 , 

qui est en contradiction avec les hypothè- 
ses ; par conséquent h est nulle sur [a, b]. 
La démonstration est terminée. 

L’équation d'Euler-Lagrange peut 
s’écrire : 

F' F" — v F” -y "F" . = 0 ; 
y y* y y y y r yy 

c’est une équation différentielle du second 
ordre et sa solution dépend de deux 
constantes arbitraires, qui sont en général 
déterminées par les conditions limites en a 
et en ri. Cette situation diffère donc du 
problème classique de Cauchy, qui 
consiste à déterminer une solution d’une 


équation différentielle du second ordre par 
sa valeur et celle de sa dérivée en un point. 

Exemple 1. Lorsque la fonction F est 
indépendante de X , l’équation d’Euler- 
Lagrange admet l’intégrale première 
F - y'Fy = C*. 

On en déduit par exemple que, pour le 
problème de la surface minimale de révo- 
lution, ses solutions sont, dans les bons cas, 
les chaînettes : 


Remarque 1. On a supposé ici que le 
minimum f était deux fois continûment 
dérivable. En fait, une étude plus fine, due 
à P. Du Bois-Reymond, permet de mon- 
trer que, si f est une fois continûment 
dérivable, la fonction F ' v >(x,f (x),f'(x)) est 
dérivable et que sa dérivée est égale à 
F ' ; {x,/(x),/'(x)) ; autrement dit, f satis- 
fait encore l’équation d' Euler-Lagrange. 

On peut de plus vérifier qu’elle est alors 
deux fois dérivable en tout point où l’on a 
F\ y (*, /(*),/'«) # 0. Ainsi l’hypo- 
thèse de départ n’était pas trop restrictive. 

Remarque 2. Certains problèmes varia- 
tionnels, par exemple celui qui correspond à 
la fonction F = y'\ 1 — y') 2 , n’ont pas de 
solutions dans l’espace 3). On est ainsi 
amené à élargir cet espace en l’espace 3)' des 
fonctions f continues et continûment déri- 
vables par morceaux sur [a, b], c’est-à-dire 
que/est continue sur [a, b] et qu’il existe une 
suite a 0 = a < a, < < a n = htelleque 
fsoit continûment dérivable sur chacun des 
intervalles [a„ a,+,]. 

On peut encore montrer qu’un mini- 
mum relatif / de J dans 3)' satisfait 
l’équation d’ Euler-Lagrange sur chacun 
des intervalles où elle est continûment 
dérivabie (c’est une conséquence immé- 
diate de la formule de Chasles pour les 
intégrales) et vérifie de plus les conditions 
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suivantes, dues à K. Weierstrass et à 
G. Erdmann : en chaque point de [ a , b] les 
limites à gauche et à droite de : 

fyOc, /(*),/'(*)) 

ainsi que celles de : 

sont égales. 

En utilisant le théorème de Rolle, on 
déduit de cette première condition qu’en 
un point de discontinuité c def’ la fonction 
F " vY (c‘,/(c), y’) à un zéro. Par consé- 
quent, si F" v y(x, y, ÿ) est sans zéro, tout 
minimum de J dans 3)' est deux fois 
continûment dérivable. 

Conditions de Legendre et Jacobi 

Soit f un minimum relatif faible de J dans 
3). Utilisant à nouveau la formule de 
Taylor, on peut écrire, toujours à des 
termes d’ordres supérieurs près, la varia- 
tion de J correspondant à une variation y 
de f sous la forme : 

\ J* [PC* Mx) i + 2Q(; C )<x>(.x) o)'(x ) 

+ R(x ) o>'(* ) 2 ] dx , 

où l’on a posé : 

P W = F'(x, /(*),/'(*)), 

QW = f ;•(*,/(*),/'(*)). 

RW = F ; y {x,f(x),f\x)). 

La fonctionnelle : 

O) K+ J 6 [Peu 2 + 2 Qqg/ + Rg)' 2 ] dx 

est une forme quadratique sur l’espace £ 
que Ton peut interpréter comme la dérivée 
seconde Ô 2 J|/] de J enf: on dira que 6 2 J[/] 
est la « variation seconde » de J en f 
On a ainsi le résultat suivant : Une condition 
nécessaire pour quef soit un minimum rela- 
tif faible de J est que Ô 2 m soit une forme 


quadratique positive, c’est-à-dire telle que 
b 2 m (u) ^ 0 P our tout O ÉE £. 

On va, suivant Legendre, transformer 
l’expression de cette variation seconde en 
remarquant que, si W est une fonction 
continûment dérivable sur [a, b], on a : 

pour toute fonction 0) (E £. On peut donc 
écrire : 

5 ! J[/i(w) = J‘ [(p t »y 

+ 2(Q + H'jwci)' -f Rü)' 2 ] dx 

soit encore : 

& 2 J[/1«) = J" R[ u' + wj 2 dx , 

si le discriminant (Q -f- vi’) 2 R(P w') 
est nul. Cette égalité nous conduit à une 
seconde condition, énoncée par Legendre 
en 1786 : 

Théorème 2. Une condition nécessaire 
pour quefsoit un minimum relatif faible 
de J est que l’on ait sur [a, b] l’inégalité : 

R (*) = F;U(x, /(*),/'(*)) ^ 0. 

Démonstration . Supposons R négative en 
un point „Yq de ]a, b[. On peut trouver un 
intervalle [c, d] contenant Aq sur lequel R 
reste négative. On peut supposer qu’il 
existe une solution de l’équation différen- 
tielle (Q w) 2 — R(P + h 7 ') = 0 sur cet 
intervalle. 

On a alors l’inégalité ô 2 J[/]((l>) < 0 
pour la fonction o) qui intervient dans la 
preuve du lemme 1, ce qui est absurde. 

L’expression précédente de 5 2 J[/] mon- 
tre que, si l’équation : 

(Q + wf + R(P + w') = 0 

a une solution sur [a, b], la condition 
R > 0 entraîne Ô 2 J[/]((l>) > 0 pour toute 
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variation « non nulle. C’est en partant de 
cette remarque que Weierstrass montra, en 
1879, que les conditions suivantes sont 
suffisantes pour qu’une fonctionf’de £) soit 
un minimum relatif faible de J : 

a) La fonction f est une solution de 
l’équation d’Euler-Lagrange ; 

b) On a F V, /(*,/(.*), /'(*)) > 0 sur 

[a, b]; 

c) Il existe une solution sur [a, b] de 
l’équation (Q + w) 2 R(P -|- w') — 0. 

Jacobi introduisit en 1837 le change- 
ment de variable w = — Q — R u'/u qui lui 
permit de transformer l’équation différen- 
tielle (Q + Vf) 2 — R(P -f- w') = 0 en 
l’équation différentielle linéaire du second 
ordre, dite équation de Jacobi : 

<P-Q>— ^(RiO-0; 

et l’existence d’une solution de la pre- 
mière sur [a, b] est équivalente à l’existence 
d’une solution sans zéro sur [a, b] de la 
seconde. 

Soit alors u(x) une solution non nulle de 
l’équation de Jacobi telle que u(a) = 0. On 
dira qu’un point c ^ a est un point conju- 
gué de a si l’on a u(c) = 0. Le théorème de 
Sturm permet de montrer que, si l’inter- 
valle [a, b] ne contient aucun point conju- 
gué de a, il existe une solution de l’équation 
de Jacobi sans zéro sur cet intervalle, donc 
une solution du discriminant sur [a, b] 
(cf. supra). 

En 1877, Weierstrass donna la condi- 
tion suivante, appelée condition de Jacobi : 

Théorème 3. Une condition nécessaire 
pour qu’une fonction j de 3) vérifiant 
F”iY (*./(*)>/'(*)) > 0 sur [a, b] soit un 
minimum relatif faible de J est que l’inter- 
valle [a, b] ne contienne aucun point conju- 
gue du point a. 

On remarquera que, contrairement aux 
théorèmes 1 et 2 qui expriment des condi- 


tions locales, la condition de Jacobi est 
globale. 

Remarque 3. Dans son important 
mémoire de 1837, Jacobi mit aussi en 
évidence la propriété importante suivante 
de l’équation qui porte son nom : 

Soit / (x, A) une famille différentiable à 
un paramètre de solutions de l’équation 
d’Euler-Lagrange telle que / (x, 0) =/ (x). 
Alors la fonction u(x) =/ \(x, 0) est une 
solution de l’équation de Jacobi ; autre- 
ment dit, l’équation de Jacobi correspon- 
dant à la fonction f est P« équation 
aux variations » de l’équation d’Euler- 
Lagrange pour sa solution /. 

Remarque 4. Les conditions données 
dans les théorèmes 1,2 et 3 concernent un 
minimum relatif faible. En 1879, Weiers- 
trass donna la condition nécessaire sui- 
vante pour un minimum relatif fort, obte- 
nue en exprimant que la valeur de J sur 
l’arc AB doit être inférieure à la somme 
des valeurs de J sur les arcs AC et CB 
(cf. figure). L’expression : 

-V -fXxW y {x,f{x\y') 

doit être positive pour tout y' et tout x dans 
[a, b] ; cette condition est en particulier 
vérifiée si l’on a : 

F ; y (x,m,y') > 0 


pour tout y ' et tout x dans [a, b]. 
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Il montra également que les conditions 
suivantes sont suffisantes pour qu’une fonc- 
tionfde 1D soit un minimum relatif fort de J : 

a) La fonction f est solution de l’équa- 
tion d’Euler-Lagrange ; 

b) On a l’inégalité F" v y(x, y, y’) > 0 
pour tout y’ et pour tout couple (x, y) dans 
un voisinage du graphe de fi 

c) L’intervalle [a, b] ne contient aucun 
point conjugué du point a. 

Théorie de Morse 

Dans son aspect classique, la théorie de 
Morse ne fait pas partie du calcul des 
variations. Elle concerne en fait l’étude des 
fonctions différentiables sur les variétés et 
permet, en particulier, de donner des 
décompositions des variétés jouant en 
topologie différentielle le rôle que jouent les 
décompositions simpliciales en topologie 
combinatoire. C’est en utilisant cette tech- 
nique que S. Smale démontra, en 1962, la 
conjecture de Poincaré en dimensions 
supérieures à 5. 

Si f est une fonction différentiable à 
valeurs réelles sur une variété M, on dit 
qu’un point z de M est un point critique de 
f s’il annule sa différentielle df, ce qui 
s’exprime, dans un système de coordon- 
nées locales X] , . . . . x n tel que Xj (z) = 0, par 
les conditions : 


Ce point critique est non dégénéré si le 
hessien H(/~) de f en z, c’est-à-dire la forme 
quadratique définie par la matrice : 



est de rang maximum. L’index de z est 
alors le nombre de valeurs propres néga- 
tives du hessien. 


Le lemme de Morse assure que, si z est 
un point critique non dégénéré d’index p, 
il existe un système de coordonnées locales 
y j, . y avec y.(z) = 0 tel que l’on ait : 

O’i,... yn)=f(Q)— y] — ... 

~yl+y ]+ 1 + +-Y:; 

ce qui montre en particulier que les 
points critiques non dégénérés sont isolés. 
On peut déduire de cette expression 
que, si a et b ne sont pas des valeurs 
critiques de et si l’intervalle ]fl, b[ 
contient une seule valeur critique, corres- 
pondant à un seul point critique z, non 
dégénéré, on obtient la sous-variété 
M h = f 1 (]— oo, 6]) en recollant à la SOUS- 
variété = f (]— oo, a]) une « anse » 

I> X D" p d’indice p, où p est l’index de 
z, au moyen d’une application différenti- 
able de 1 X D" -/? dans le bord de M„. 
La variété Mj, a donc le type d’homotopie 
de l’espace obtenu en recollant à M, une 
cellule de dimension p. On en déduit par 
exemple que le q-ième nombre de Betti de 
M est inférieur au nombre de points 
critiques d’index q de f. 

L’originalité de Morse fut alors de mon- 
trer, en 1934, que, sur une variété rieman- 
nienne M, on pouvait raisonner de façon 
analogue pour l’espace Q(M ; /?, q) = Q 
des courbes Coo par morceaux joignant p à 
q (qui est une variété banachique) et la 
fonction E : Q — * R définie par : 

«nst* 

qui est différentiable sur Q. 

On se trouve ici devant un problème 
variationnel pour lequel les solutions de 
l’équation d’Euler-Lagrange, qui sont les 
points critiques de E, sont les géodésiques 
C J oo joignantp à q (cf. Remarques 1 et 2). Le 
hessien de E pour une géodésique y est la 
variation seconde de E en y, et y est un 
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point critique non dégénéré de E si et 
seulement si cette variation seconde est une 
forme définie. On peut montrer qu’il en est 
ainsi si le point q n’est pas conjugué du 
point p (en un sens qui généralise directe- 
ment celui du chapitre 5) le long de y. 

Dans ces conditions, le plus grand 
sous-espace sur lequel le hesrien est défini 
négatif est de dimension finie, et sa dimen- 
sion est égale au nombre de points conju- 
gués de p sur y comptés avec leur ordre de 
multiplicité (puisque l’équation de Jacobi 
est dans ce cas une équation linéaire du 
second ordre et de dimension n , cette 
multiplicité est toujours inférieure à n). 

Le résultat central de la théorie de 
Morse assure alors que, si p et q ne sont 
conjugués le long d’aucune géodésique, 
l’espace Q a le type d’homotopie d’un 
complexe simplicial dénombrable ayant 
une cellule de dimension d pour chaque 
géodésique d’index djoignantp à q (en fait, 
ce type d’homotopie est un invariant 
topologique de la variété). 

Par exemple, les géodésiques de la 
sphère euclidienne sont les arcs de grands 
cercles, et deux points sont conjugués si et 
seulement s’ils sont diamétralement oppo- 
sés ; la multiplicité pour le demi-grand 
cercle est alors n — 1. On en déduit que, si 
p et q ne sont pas diamétralement opposés, 
l’espace Q(S' f ; /?, q) a le type d’homotopie 
d’un complexe simpiicial ayant une cellule 
en dimensions 0 , n — 1 , 2 (n — 1), 3 (tt 1), 

Ce résultat, qui reste vrai pour toute 
variété riemannienne homéomorphe à S", 
permet de montrer l’existence globale de 
géodésiques. 

En 1957, R. Bott, appliquant ces métho- 
des aux groupes unitaire U(n, C) et ortho- 
gonal 0(n, R), a montré, ce qui est un 
résultat fondamental pour la topologie 
moderne, la périodicité des groupes 
d’homotopie de ces espaces : par exemple, 


7T 2 , (U) = 0 et 7T 2H _,(U) = Z pour le 
groupe unitaire 

y = lim U(», C). 

CLAUDE GODBILLON 
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I ssues d’un calcul formel d’Euler, la 
« fonction zêta » de Riemann et les 
« fonctions L » de Dirichlet ont été 
jusqu’ici les outils analytiques les plus 
puissants pour étudier la répartition et les 
propriétés des nombres premiers. Mais ces 
fonctions sont elles-mêmes devenues 
l’objet d’études analytiques poussées, 
en raison de leurs propriétés très particu- 
lières qui semblent être liées aux compor- 
tements les plus cachés de la théorie des 
nombres et sont encore loin d’être bien 
comprises. 

Le mouvement d’idées qui tend, depuis 
1920, à l’unification de la théorie des 
nombres et de la géométrie algébrique a 
conduit à définir, dans cette dernière 
théorie, des « fonctions zêta » et des 
« fonctions L » analogues aux fonctions 
classiques et présentant un comportement 
semblable. Il y a lieu de penser qu’on se 
trouve en présence de fragments encore 
mal reliés d’une vaste théorie générale, 


participant de l’analyse, de la théorie des 
groupes et de la géométrie algébrique, qui 
nous fera un jour pénétrer dans les recoins 
les plus mystérieux de la « reine des 
mathématiques » (C. F. Gauss), l’étude 
des nombres entiers. 

La fonction zêta de Riemann 

La série : 



avec n s = exp(— S ln ri), et le produit 
infini : 

(2) no-^. 

p 

étendu aux nombres premiers p , sont 
tous deux absolument convergents 
pour s = o + it de partie réelle a > 1 et 
représentent la même fonction analy- 
tique £(j) dans ce domaine. Le résultat 
fondamental de Riemann est qu’il est 
possible de prolonger cette fonction 
en une fonction mèromorphe dans 
tout le plan, vérifiant l’équation fonction- 
nelle : 

(3) «t)=£(l-jX 
où l’on a posé : 

(4) 5( î ) = i i ( i -l) î r^rQt(î). 

Une des démonstrations de Riemann 
lie la fonction zêta à une fonction thêta de 
Jacobi, grâce à l’expression de r(s) par 
l’intégrale eulérienne qui donne : 

ir-r(s)C(2i) = — 
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où l’on a : 


(5) 9(x) = ^ y exp(mn '-x) 

1 

2 + 

n - 1 

pour Imx > 0. L’identité fondamentale 
qui exprime la propriété « modulaire » de 
la fonction thêta : 


y 1 exp (nin 2 x ), 


(6) e(- -‘)= (-à)^e(x), 

avec la détermination de la racine carrée 
z^ 2 positive pour z réel > 0, donne alors : 

(7) 7r-‘I»C(25) 

= JjV 1 + 

1 1 

2 s 2 s — 1 

Vu la décroissance exponentielle de 
0(/‘f ) 1/2 à l’infini, l’intégrale dans cette 

formule converge pour toutes les valeurs 
complexes de s et ne change pas quand on 
remplace s par — s + 1/2, d’où l’équa- 
tion (3). 

On voit aussitôt que s = 1 est le seul 
pôle de ^( 5 ) ; il est simple et de résidu 1 ; 
les points 2, -4, sont des zéros 

simples de Ç(y), dits « triviaux ». Les seuls 
autres zéros de Ç(.s) sont tels que 0 ^ a ^ 1 
et Riemann a émis l’hypothèse, non encore 
démontrée, que tous ces zéros sont sur la 
droite a = 1/2. On a en outre, pour le 
nombre N(T) des zéros contenus dans le 
rectangle 0 ^ a ^ 1,0 ^ f ^ T, l’expres- 
sion asymptotique : 


(8) N(T) = — TlnT- 
2 tt 


1 + ln 2 tt 
2ir 


T 

+ 0(ln T). 


où 0 désigne le symbole de Landau 

(Cf. CalCUlS ASYMPTOTIQUES, chap. l). 


Riemann avait annoncé sans démons- 
tration qu’il y a en fait une infinité de zéros 
sur la droite (J = 1/2 ; ce résultat fut prouvé 
par G. H. Hardy en 1914 et A. Selberg a 
établi en 1942 qu’il y aune constante A > 0 
telle que le nombre de zéros pour lesquels 
011 a O = 1 /2 et 0 ^ t ^ Testsupérieurou 
égal à AT ln T. On a calculé numérique- 
ment plus de trois millions de zéros de £(j) 
et on les a tous trouvés sur la droite 0=1/ 
2. Il faut noter toutefois qu’on connaît des 
exemples de séries de Dirichlet vérifiant des 
équations fonctionnelles du type (3) et 
ayant cependant une infinité de zéros où 
CI > L 

Fonction zêta et fonctions L 
d’un corps de nombres algébriques 

R. Dedekind généralisa la définition des 
fonctions zêta et L à un corps de nombres 
algébriques k, en prenant : 

( 9 ) L(s, X) ='Y / X(a)(Na)— * 


= n a — x(pxnp)-')- 1 , 

p 

où a parcourt l’ensemble des idéaux entiers 
de k, où p parcourt l’ensemble des idéaux 
premiers, où Na est la norme de l’idéal a, 
c’est-à-dire le nombre d’éléments de o/a (où 
o est l’anneau des entiers de k) et où % est 
un caractère du groupe des idéaux ^ 0 
(pour = 1, on a la fonction zêta). 
E. Ecke put établir que ces fonctions sont 
méromorphes et vérifient des équations 
fonctionnelles analogues à (3). Il introdui- 
sit d’autres fonctions L à l’aide de carac- 
tères plus généraux que ceux de Dedekind 
et put encore, au prix de calculs difficiles, 
prouver l’existence d’équations fonction- 
nelles. Dans sa thèse de 1950, J. Tate a 
montré comment la théorie des idèles 
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permet une exposition simple et unifiée de 
tous ces travaux qui, en définitive, peuvent 
être fondés sur la transformation de Fou- 
rier dans le groupe des adèles de k 
(rappelons que la propriété (6) est une 
conséquence de la formule de Poisson de 
la théorie de Fourier classique). Dans la 
théorie de Tate, on considère d’une part le 
groupe additif k A des adèles de k et sa 
mesure de Haar t/a, normalisée de sorte 
que k A jk ait pour mesure 1 ; il y a sur k A 
un caractère X : k A — ► T = R/Z tel que 
l’application : 

(a, b) t— ►exp (2 7 t/X(ab)) 

identifie k A à son dual de Pontriaguine. La 
transformée de Fourier d’une fonction 
intégrable sur k A est alors donnée par : 

($7)(b) = J/ (a) exp( — 2 7nX(ab)) d a 

et on a la formule d’inversion habituelle 
(T (v7/))(a) =/(— a) sifest suffisamment 
régulière. On considère d’autre part le 
groupe multiplicatif des idèles k A et sa 
mesure de Haar d* a. On appelle quasi- 
caractère d e k% un homomorphisme 
continu c : k A — ► C* qui est égal à 1 sur 
k* (de sorte qu’il s’agit en fait d’un 
homomorphisme dans C* du groupe k\jk 
des classes dïdèles). Pour un tel quasi- 
caractère c\ il y a un nombre réel p bien 
déterminé tel que l’on ait | c(a) | = ja| M 
pour tout idèle a ; on dit que c’est l’expo- 
sant de c. Pour des «fonctions poids » 
f : k A — ► C satisfaisant à certaines condi- 
tions de régularité, on pose alors : 

(10) W,c)= J7(a)c(a)rf*a, 

intégrale qui a un sens pour tout quasi- 
caractère d’exposant > 1. 

Un quasi-caractère peut toujours 
s’écrire (de plusieurs manières) 


c( a) = x(a) a |*, où X est un caractère de 
k%/k* (« Grossencharakter » dans la ter- 
minologie de Hecke) et s un nombre 
complexe ; deux quasi-caractères corres- 
pondant au même caractère X sont dits 
équivalents ; l’ensemble des quasi- 
caractères équivalents à un quasi-caractère 
donné a donc une structure complexe et 
l’on peut parler de « prolongement analy- 
tique » d’une fonction holomorphe dans 
un ensemble ouvert de l’ensemble des 
quasi-caractères. 

Le théorème fondamental de Tate est 
alors que, pour une fonction poids f 
donnée la fonction c »— ► Ç(/’ c), définie 
seulement pour les quasi-caractères 
d’exposant > 1, se prolonge en une fonc- 
tion méromorphe sur l’ensemble de tous les 
quasi-caractères ; ses seuls pôles sont le 
caractère trivial Xo : a 1 et le quasi- 
caractère « module » N : a a |, avec 
des résidus respectivement égaux à (3 */(0) 
et — (3 . S-f(0), où p est le volume de 
k A /k* pour la mesure de Haar additive da. 
Enfin, on a l’équation fonctionnelle : 

(11) C <f,c)= t (*/,<?), 

où c est le quasi-caractère 
c( a) =/a (c(a)))’ (de sorte quec = c). La 
démonstration est une adaptation facile de 
celle de Riemann rappelée plus haut ; on 
décompose l’intégrale (10) en deux autres, 
étendues respectivement aux idèles tels que 
[ a | C 1 et aux idèles tels que | a | ^ l,eton 
ramène la première au domaine | a) ^ 1 
par changement de variable et utilisation 
de la formule générale de Poisson de 
l’analyse harmonique. 

Pour retrouver à partir du théorème de 
Tate les résultats de Hecke et de Dedekind, 
on spécialise la fonction poids ; on prend : 

/W = n/.'W 
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où, pour chaque place v de k, a est le 
composant de Fidèle a dans le corps local 
k v et /y une fonction convenable sur k 
D’autre part, si l’on a c(a) = %(a) a on 
désigne par S y l’ensemble fini des places de 
k formé des places infinies et des places 
finies où y prend des valeurs ^ 1 dans le 
groupe des unités de k Alors, si l’on pose : 

(12) L(s, x) = JJ (1 _ x(p)(Np)-*)-‘, 

pes x 

on trouve l’égalité l(f, c) = 4>(.ç)L(.î, '/) où 
W) est un produit de fonctions de la 
forme s » T(a5 + (3) w , expression dans 
laquelle a et (3 sont des constantes com- 
plexes et m un entier rationnel, et de 
fonctions rationnelles par rapport à un 
certain nombre de puissances p v , où les p 
sont des constantes non milles. L’équation 
fonctionnelle (11) se réduit alors à l’équa- 
tion de Hecke pour la fonction L. 

Fonctions zêta et fonctions L 
sur une variété algébrique 
définie sur un corps fini 

Depuis les travaux de E. Artin, on sait que 
tous les résultats de la théorie des nombres 
algébriques se transportent (avec des 
expressions plus simples, dues à l’absence 
des « places infinies ») aux «corps de 
fonctions algébriques d’une variable sur un 
corps fini F, », c’est-à-dire les extensions 
algébriques finies du corps des fractions 
rationnelles F,(X). E. Artin lui-même avait 
noté, sur le cas particulier des extensions 
quadratiques de F,(X), que la définition de 
Dedekind de la fonction zêta se généralise 
à un tel corps k en prenant pour p toutes 
les places de k et pour Np le nombre 
d’éléments du corps résiduel de la place p. 
La théorie de Tate s’étend également sans 
difficulté. 


Mais on peut considérer k comme le 
corps des fonctions rationnelles sur une 
courbe algébrique irréductible définie sur 
; ce point de vue amène à une nouvelle 
généralisation, en remplaçant la courbe 
par une variété algébrique X de dimension 
quelconque définie sur F^. Pour simplifier, 
on supposera qu’il s’agit d’une variété 
affine, ensemble des points x = (Xj, . . . . x m ) 
d’un espace F™, où F^ est la clôture 
algébrique de F^, vérifiant un nombre fini 
d’équations P a (Xj, .... x„) = 0, où les P a 
sont des polynômes à coefficients dans F,,. 
Soit a l’idéal de l’anneau de polynômes 
FJTj, .... T,,] engendré par les P,. Tout 
point x G X définit un homomorphisme 
FJTj, . T w ] —► F^ transformant T, en x f 
pour 1 ^ j ^ m et s’annulant dans a ; 
réciproquement, un tel homomorphisme 
correspond à un point x G X et à un seul. 
L’image de cet homomorphisme est un 
corps fini, extension de F^, ayant donc q h 
éléments ; on pose h = deg(x). On montre 
alors que le produit infini : 

(13) z(x,<) = JL 1- fdeel * )) 

xEX 

est, pour t < absolument conver- 

gent et l’on définit la fonction zêta de X 
par : 

(14) C(X, 5) = Z(X, q- s \ 

On voit facilement que, pour tout entier 
fl ^ 0, il n’y a qu’un nombre fini v„ de 
points de X tels que deg(x) = n, et on 
déduit de (13) l’égalité : 

» 

(15) LogZ(X,t) =£v„£ 

n = 1 

Le nombre v„ s’interprète à l’aide de 
l’uutomorphisme de Frobenius F de X, qui 
à tout point (X), . . . . x w ) de X fait corres- 
pondre le point (Xj 9 , .... X^) ; V rt est 
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simplement le nombre des points de X 
fixes par F". Cette interprétation, d’abord 
introduite par A. Weil, est à la base de tous 
les résultats récents obtenus sur les fonc- 
tions zêta des variétés X. 

On définit de la même manière la 
fonction Z(X, t ) lorsque X est une variété 
projective sur F, ou une variété « abs- 
traite » au sens de A. Weil ou de 
J. -P. Serre. Lorsque X est une courbe 
projective sans singularité de genre g, 
F. K. Schmidt a montré en 1929 que l’on 
peut écrire : 

zi*.,), ,, J,;!-,,) - 

où est un polynôme de degré 2g, et on 
a l’équation fonctionnelle : 

(17) z(i)= 9 '-*; 2 - 2 ‘Z(/); 

en outre, H. Hasse pour g = 1 et A. Weil 
pour le cas général montrèrent que les 
zéros de P-^ sont tels que t = ce qui 
correspond dans ce cas à l’« hypothèse de 
Riemann ». Pour X (projective ou non) de 
dimension quelconque, B. Dwork montra 
en 1960 que Z(X, f ) est encore une fonc- 
tion rationnelle de t. Par exemple, si 
X = F™. , on a C(X, s) = (1 - q m ~ s )~' , 
Grâce à l’introduction d’une notion de 
« cohomologie » pour les variétés sur un 
corps quelconque, A. Grothendieck et 
M. Artin ont montré que, si X est une 
variété projective irréductible sans singu- 
larité de dimension fi sur F^, la fonction 
zêta vérifie l’équation fonctionnelle géné- 
ralisant (17) : 

( 18 ) z(L)= (_ DV-^zn 

où k est la « caractéristique d’Euler- 
Poincaré » de X pour cette cohomologie. 
Mais on n’a pas encore obtenu de démons- 


tration de P« hypothèse de Riemann » 
correspondante qui serait que les zéros de 
Z(X, t ) soient tous sur le cercle t | = cf* 2 . 

Suivant une idée de E. Artin, on peut 
aussi définir des « fonctions L » relatives à 
l’action d’un groupe fini G (commutatif ou 
non) opérant dans la variété X ; on pose : 


(19) 


ln L(X, x 


:') = Z V " 


(X) 


t n 

n 


pour un caractère ^ de G, les nombres 
v„(x) étant définis par : 


(20) v„( X )= (Card G)“ 




A (s F„ ), 


où A^çF") est le nombre de points de X 
fixes par l’automorphisme sF n . A. Gro- 
thendieck et J.-L. Verdier ont montré que 
ces fonctions sont encore rationnelles. Une 
des propriétés les plus importantes de ces 
fonctions est qu’elles fournissent une fac- 
torisation de la fonction zêta : 


(21) Z(x, D = JJ L(X, x ; t )*«*>, 

X 

où % parcourt l’ensemble des caractères de 

G. 


Fonction zêta et fonctions L 
sur une variété algébrique 
« définie sur Z » 

Considérons maintenant dans l’anneau de 
polynômes Z[Tj, T,„] un idéal a et 
convenons de dire qu’il définit une 
« variété X sur Z » (le langage adapté à 
cette situation est celui des « schémas » de 
Grothendieck). Pour chaque nombre pre- 
mier /?, l’ homomorphisme canonique : 

Z^Z/pZ = F p 
définit un homomorphisme : 
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transformant a en un idéal a,„ définissant 
par suite une variété algébrique X. p sur F^. 
On peut alors, tout au moins formellement, 
considérer le produit : 

(22) t(X, s ) = jq C(X,,5) 


lorsque G opère sur X, c’est-a-dire lorsque 
G opère sur ZjTj, .... T,„] en laissant stable 
l’idéal a ; on a donc encore une factorisa- 
tion : 

(24) C(X, s) = L(X, x 


étendu à tous les nombres premiersp ; c’cst 
la fonction zêta de Hase- Weil. Par exemple, 
si l’on prend a = (0), on trouve 

Ç(X, s) = Ç(w ■S’) ou > au second membre, 

Ç est la fonction de Riemann. Si n est la 
dimension de X (qu’on définit ici comme le 
plus grand nombre tel qu’il y ait une chaîne 
strictement croissante Po C P| C C P„+i 
d’idéaux premiers de Z[Tj, .... T,] conte- 
nant a), on montre que le produit (22) est 
absolument convergent pour Re S > n . On 
conjecture que Ç(X, 5) peut se prolonger en 
une fonction méromorphe dans tout le plan 
et vérifiant une équation fonctionnelle ana- 
logue à (3) : mais on ne sait jusqu’ici prou- 
ver cette conjecture que dans un petit nom- 
bre de cas où X est soit une courbe 
algébrique d’un type très particulier, soit 
une variété abélienne d’un type spécial, soit 
enfin certaines variétés fibrées ayant pour 
base une courbe algébrique et pour fibres 
des variétés abéliennes. Dans chacun de ces 
cas, on parvient au résultat par un calcul 
explicite de Ç(X, s) à l’aide de fonctions L de 
Hecke ou de Dedekind. En général, on sait 
seulement prolonger analytiquement 
t(X, s) en une fonction méromorphe dans 
le demi-plan Re s > n — 1/2 et, si X ^ 0, 
le point s = ïl est un pôle d’ordre égal au 
nombre de composantes irréductibles de X 
de dimension n . 

On peut aussi considérer les fonctions L 
que l’on définit par une formule analogue 
à (22) : 

(23) L(X, x;s) = JT L(X,, x ; s) 

P 
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Équations fonctionnelles 
et représentation des groupes 
On peut considérer que l’intégrale eulé- 
rienne : 


r(s) — J x s ~ ] e~ x dx 

définit F comme « transformée de Mellin » 
de e~ x t la transformation de Mellin se 
déduisant de la transformation de Laplace 
bilatère (ou transformation de Fourier- 
Laplace) qui à une fonction f fait corres- 
pondre la fonction : 

e ts f(t)dt, 

par le changement de variable X = é dans 
l’intégrale ; la « formule d’inversion » de la 
transformation de Mellin donne alors : 




1 

2tti 


c + '°°;c— T (y)ds, 

f—1 00 


où l’intégrale est prise le long de la droite 
t >— ► c -F it dans le plan complexe, avec 
C > 0. La démonstration de l’équation 
fonctionnelle de (,(.?) par Riemann rappe- 
lée plus haut conduit à l’idée plus générale 
d’attacher à une série de Dirichlet : 


(25) 4>(f) = 

n - 1 

convergente dans un demi-plan, donc telle 
que a,, = 0(n c ) pour c > 0, la fonction /, 
analytique dans le demi-plan H tel que 
Im Z > 0, définie par : 

(26) f(z) = y a „ exp ( 2m ”^)’ 



ZETA FONCTION 


pour À > 0, de sorte que la fonction : 

(27) *(S) =(^) _! r(s)<j>(s) 

soit transformée de Mellin de f . Généra- 
lisant la méthode de Riemann, E. Hecke a 
remarqué que les propriétés (A) et (B) 
suivantes sont équivalentes. 

Propriété (A). La fonction : 

*CO + ^ + e^, 

s k — s 

ou £ = * 1, est entière et bornée dans 
chaque « bande » Re s ( a et vérifie, 
pour un k > 0, l’équation fonctionnelle : 

(28) $(k — s) = 8<ï>(s). 

Propriété (B). On a : 



Lorsque <È>(j) = C(2s), on a6 = 1, À = 2 
et k = 1/2. Une fonction analytique dans 
H de la forme (26), donc telle que 
f(z + A) = f (z), et vérifiant en outre (B) 
est dite forme modulaire de dimension k et 
de multiplicateur £ pour le groupe G(h) 
engendré par les deux automorphismes 
Z Z + A et z 1 — * — 1/z du demi-plan H. 
Le cas le plus important est celui où A z= 1 , 


le groupe G( 1) n’étant autre alors que le 
groupe modulaire des transformations : 

az + b 

z * -> 

cz + d 

avec a, b y c et d dans Z et avec 
ad — hc = 1 ; ce groupe est le quotient de 
SL(2, Z) par son centre. 

On aperçoit donc là le début d’une 
étroite relation entre la théorie des repré- 
sentations des groupes (du groupe GL(2) 
pour commencer) et les propriétés arith- 
métiques des courbes algébriques définies 
sur un corps de nombres, par le biais des 
fonctions zêta et L attachées à ces courbes. 

JEAN DIEUDONNÉ 
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Certaines ENTRÉES de cet index sont aussi des titres d’articles : dans ce cas, elles sont pré- 
cédées d’une puce et suivies d’un folio (exemple : • ALGÈBRE 12 ). 

En l’absence de puce et de folio, le mot joue seulement le rôle d’entrée d’index (exemple : 
ADÈLES). 

Pour plus d’informations sur le fonctionnement de l’index, voir page 9. 
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Sources et applications 184 
DÉRIVÉES PARTIELLES (ÉQUATIONS Aux) - 
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NEPER ou NAPIER john (1550-1617) 

EXPONENTIELLE ET LOGARITHME 342 

NÉPÉRIEN LOGARITHME 

EXPONENTIELLE ET LOGARITHME 339 

NEUMANN CARL (1832-1925) 

intÉgrALes (Équations) 604 
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BESSEL (FONCTIONS DE ) 64 , 66 
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algébriques 6 97 
QUADRATIQUES (FORMES) 782 
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INTÉGRALES (Équations) 608 

OPÉRATEUR DIFFÉRENTIEL 
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DÉRIVÉES PARTIELLES (ÉQUATIONS AUX) ■ 
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OPÉRATEUR HYPOELLIPTIQUE 

DÉRIVÉES pArTIelles (Équations AUX) ■ 

Théorie linéaire 190 , 195 

OPÉRATEUR INTÉGRAL 

INTÉGRALES (Équations) 605. 608 

OPÉRATION D'UN GROUPE 
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QUADRATIQUES (FORMES) 780 

TOPOLOGIQUE (ALGÈBRE) 854 
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ORTHOGONALITÉ 
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groupes 557, 559 
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LINÉAIRE ET MULTILINÉAIRE (algÈbre) 628 , 
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ORTHOGONAUX (POLYNÔMES) 751 
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QUADRIQUES 797 
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ASYMPTOTIQUES (CALCULS) 50 

PARTITION D’UN ENSEMBLE 
combInatoIre (analyse) 106 

ENSEMBLES (THEORIE 'ELEMENTAIRE DES) 307, 

316 

PASCAL BIAISE (1623-1 662) 

GÉOMÉTRIE 464 

PASCAL THÉORÈME DE 
CONIQUES 121 

PEANO GIUSEPPE (1858-1932) 

CALCUL INFINITÉSIMAL ' Calcul à plusieurs 
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PELL Équation 0ë, 

DIOPHANTIENNES (Équations) 2 64 
nombres (thÉorie des) ■ Nombres 
algébriques 697, 710 

PÉRJODJQUE FONCTION 

différentielles (ÉquaTions) 238 
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FONCTIONS ANALYTIQUES ■ Fonctions 

elliptiques et modulaire 433 

HARMONIQUE (ANALYSE) 584 

PERMUTATION 

COMBINATOIRE (ANALYSE) 105 

groupes • Groupes finis 546 

PERTURBATION MÉTHODE des 

DIFFÉRENTIELLES (ÉQUATIONS) 238 

P.G.C.D. ► PLUS GRAND COMMUN 
DIVISEUR 

P-GROUPES 

groupes - Groupes finis 553 

PHASE STATIONNAIRE MÉTHODE DE la 

ASYMPTOTIQUES (CALCULS) 57 

PHYSIQUE MATHÉMATIQUE 
BESSEL (FONCTIONS de) 63 
DERIVEES PARTIELLES (ÉQUATIONS AUX) 171 

PJ 

COMPLEXES (NOMBRES) 118 
EXPONENTIELLE et logarithme 349 

PICARD Émile (1856-1941) 

fonctions analytiques - Fonctions d’une 
variable complexe 424 


PISOT NOMBRES DE 

DIOPHANTIENNES (approximations) 2 61 

PLAN OSCULATEUR 

GÉOMÉTRIE DIFFÉRENTIELLE CLASSIQUE 500 

PLAN TANGENT 

GÉOMÉTRIE DIFFÉRENTIELLE CLASSIQUE 508 

PLANCHEREL THÉORÈME DE 

DÉRIVÉES parTIElles (Equations aux) 

Théorie linéaire 196 

PLATEAU PROBLÈME DE 

VARIATIONS (CALCUL DES) 876 

PLONGEMENT 

PROJECTIFS (espace et repÈRE) 
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(P.G.C.D.) 

ANNEAUX COMMUTATIFS 30 
ORDONNÉS (ensembles) 750 

PLUS PETIT COMMUN MULTIPLE 
(P.P.C.M.) 

ANNEAUX COMMUTATIFS 17, 33 
ORDONNÉS (ensembles) 750 

POINCARÉ HENRI (1854-1 9 12) 

ASYMPTOTIQUES (CALCULS) 51 
DIFFÉRENTIELLES (ÉQUATIONS) 237 

DIOPHANTIENNES (Équations) 270 
ergoDiQue (thÉorie) 32 9 

FONCTIONS ANALYTIQUES ■ FonCÜOnS 

elliptiques et modulaire 437 

POINCARÉ-BENDJXON théorème de 
DIFFÉRENTIELLES (ÉQUATIONS) 243 

POINT D’ACCUMULATION ou VALEUR 
D’ADHERENCE D’UNE SUITE 

mÉtriques (espaces) 65 8 
TOPOLOGIE GÉNÉRALE 848 

POINT DE REBROUSSEMENT 

GÉOMÉTRIE DIFFÉRENTIELLE CLASSIQUE 501 

POINT D’INFLEXION 

COURBES ALGÉBRIOUES 163 

GÉOMÉTRIE DIFFÉRENTIELLE CLASSIQUE 500 

POINT EXTRÉMAL 
convexité . Ensembles convexes 134,141 

POINT FIXE théorèmes de 
convexité ■ Ensembles convexes 141 

MÉTRiques (eSpACes) 661 

POINT MULTIPLE 

COURBES ALGÉBRIQUES 162 

POINT RÉGULIER 

DIFFÉRENTIELLES (ÉQUATIONS) 243 
fonctions ANALYTIQUES - Fonctions d'une 

variable complexe 428 

GEOMETRIE ALGEBRIQUE 488 

GEOMETRIE DIFFERENTIELLE CLASSIQUE 500 

POINT SIMPLE 

COURBES ALGÉBRIQUES 162 

POINT SINGULIER 

COURBES ALGÉBRIQUES 165 

fonctions analytiques Fonctions d’une 
variable complexe 422. 42X 
GÉOMÉTRIE DIFFÉRENTIELLE CLASSIQUE 501 
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POLYÈDRE 
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POLYNÔME CARACTÉRISTIQUE 

DIFFÉRENTIELLES (ÉQUATIONS) 225 
SPECTRALE (thÉorie) 818 

POLYNÔME CONSTANT 

POLYNÔMES 757 

POLYNÔME MINIMAL 

corps 154, 156 

. POLYNÔMES 756 

ANNEAUX COMMUTATIFS 30 , 32. 36 

CALCUL infINITÉsimal Calcul à plusieurs 

variables 92, 97, 100 
CORPS 151 

COURBES ALGÉBRIQUES 161 
FONCTIONS (REPRÉSENTATION et 
APPROXIMATION DES) 372 378 . 391 

nombres (théorie dÉs) Nombres 
algébriques 713 

POLYNÔMES ORTHOGONAUX 
► ORTHOGONAUX POLYNÔMES 

POLYNOMIALE fonction 

GÉOMÉTRIE ALGÉBRIQUE 476 
POLYNÔMES 760 

POLYTOPE 

convexité - Ensembles convexes 137, 139 
PONCELET jean victor ( 17X8-1 867) 

GÉOMÉTRIE 465 

PONTRIAGUIN E-VAN KAMPEN théorème 

DE DUALITÉ DE 

HARMONIQUE (analyse) 593 

POSITIVE FORME 

QUADRATIQUES (formes) 784, 786 

POSTULAT 

GÉOMÉTRIE 458, 468 

. POTENTIEL & FONCTIONS 
HARMONIQUES 762 

ERGODIQUE (thÉorie) 335 

fonctions ANALYTIQUES ■ Fonctions d'une 

variable complexe 410 

INTÉGRALES (ÉQUATIONS) 604 

P.P.C.M . PLUS PETIT COMMUN 

MULTIPLE 

PREMIER idéal 
ANNEAUX COMMUTATIFS 29, 32. 34 

nombres ( "heorie des) - Nombres 

algébriques 713 


PREMIERS ENTRE EUX ÉLÉMENTS 

ANNEAUX COMMUTATIFS 30 

DIVISIBILITÉ 288 

PRESQUE PÉRIODIQUE FONCTION 

HARMONIQUE (ANALYSE) 588 

PRIMAIRE idéal 
ANNEAUX COMMUTATIFS 29 

PRIMITIVE, analyse mathématique 

CALCUL INFINITÉSIMAL Calcul à une 
variable 81 

fonctions analytiques * Fonctions d’une 

variable complexe 408, 413 
INTEGRATION ET MESURE 521 

PRIMITIVE RACINE RACINE 
PRIMITIVE 

PRINCIPAL ANNEAU 

ANNEAUX COMMUTATIFS 29 
nombres (thÉorie des) Nombres 

p-adiques 689 

PRINCIPAL IDÉAL 

ANNEAUX COMMUTATIFS 28, 32 

PROBABILITÉS CALCUL DES 
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INTÉGRATION ET MESURE 613 

PRODUIT DIRECT 
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533, 538 
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SÉRIES ET PRODUITS INFINIS 805 
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PROJECTIFIÉ 
QUADRIQUES 792 

. PROJECTIFS espace & RepERe 775 
COMBINATOIRE (ANALYSE) /// 

GEOMETRIE ALGEBRIQUE 474, 486 

GROUPES Groupes classiques et géométrie 

531 

PROJECTIVES (APPLICATIONS) 

TOPOLOGIE GENERALE 845 

PROJECTION 

GÉOMÉTRIE 464, 466 

lINÉaire et MULTILINÉAIRE (algÈbre) 631 
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QUADRATIQUES formes 777 

CONIQUES 120 
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padiques 694 
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algébriques 699, 715, 719 

QUADRIQUES 792 

QUADRIQUES 790 
DIOPHANTIENNES (ÉQUATIONS) 271 

GEOMETRIE DIFFERENTIELLE CLASSIQUE 506 

QUASI ANALYTIQUE 

FONCTIONS (représentation et 
APPROXIMATION^ ' DES) 371 

QUASI-CARACTÈRE 

ZÊTA (FONCTION) 885 

QUATERNIONS 

ALGÈBRE 22 

ANNEAUX ET ALGÈBRES 42 

QUOTIENT ANNEAU 

ANNEAUX COMMUTATIFS 29 
ANNEAUX ET ALGÈBRES 45 

QUOTIENT espace vectoriel 

LINÉAIRE ET- : MULTILINÉAIRE (ALGÈBRE) 628 

RACINE D’UNE, ÉQUATION 

EQUATIONS ALGEBRIQUES 323. 325 

NOMBRES (THEORIE DES) - Nombres 

algébriques 697, 708 

RACINE D’UN POLYNÔME 

COMPLEXES (NOMBRES) 116 
ORTHOGONAUX (POLYNÔMES) 752 

POLYNÔMES 761 

TRANSCENDANTS (nombres) 871 

RACINE PRIMITIVE 

DIVISIBILITÉ 291 

nombres (théorie des) ■ Nombres 
padiques 691 

nombres (théorie des) Nombres 

algébriques 698 

RACINES N-IÈMES 
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RADON JOHANN (1887-1 956) 

INTÉGRATION ET MESURE 618 


RADON MESURE DE 

FONCTIONS (REPRÉSENTATION et 

APPROXIMATION DES) 365 
INTÉGRATION ET MESURE 619 
Spectrale (thÉorIe) 826 

RADON-NIKODYM THÉORÈME DE 

INTÉGRATION ET MESURE 621 
NORMÉS (ESPaCes VECTORIELS) 741 

RAMANUJAN SRINIVASA (1887-1 920) 
DIOPHANTIENNES (ÉQUATIONS) 274 

nombres (théorie des) ■ Théorie analytique 
673 

RAMSEY THÉORÈME de 

COMBINATOIRE (ANALYSE) 109 

RANG D’UNE APPLICATION LINÉAIRE 

LINÉAIRE Ef'. • MULTILINÉAIRE (ALGÈBRE) 637 

RANG D’UNE MATRICE 

LINÉAIRE et MULTILINÉAIRE (ALGÈBre) 642 
QUADRATIQUES (FORMES) 780 

RANG D’UN SYSTÈME LINÉAIRE 

LInÉAire et MULTILINÉAIRE (ALGÈbre) 643 
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DÉRIVÉES partielles (ÉQuaTIons AUX) * 
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fonctions analytiques;: Fonctions d’une 
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INTÉGRATION ET MESURE 611 

LIMITE (NOTION de) 

TOPOLOGIQUE (ALGÈBRE) 850 
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RÉFLEXIVE RELATION 
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RÉGLÉE FONCTION 

CALCUL INFINITÉSIMAL Calcul à Une 

variable 74 
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NORMÉES (AlGÈBres) 725 

RELATIONS 

ENSEMBLES (THÉORIE Élémentaire DES) 310 
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GÉOMÉTRIE DIFFÉRENTIELLE CLASSIQUE 497 
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REPRÉSENTATION INTÉGRALE 

ASYMPTOTIQUES (CALCULS) 61 
BESSEL (FONCTIONS DE) 65 
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REPRÉSENTATION LINÉAIRE DES 

GROUPES 

groupes ■ Représentation linéaire des 
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COURBES ALGÉBRIQUES 165 

GÉOMÉTRIE DIFFÉRENTIELLE CLASSIQUE 504 

RÉSEAU 
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DIVISIBILITÉ 292 
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algébriques 698 

RÉSIDUS THÉORÈME DES 
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RESTES CHINOIS théorème des 

DIOPHANTIENNES (ÉQUATIONS) 263 

RÉUNION 

ENSEMBLES (théorie Élémentaire DES) ?()2 
306 

REVÊTEM ENTS 
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